OpenAI повідомляє про оновлення ChatGPT, завдяки якому користувачі зможуть створювати AI-зображення безпосередньо в чат-боті. Причому ця функція буде доступна не лише для користувачів ChatGPT Plus, Pro та Team, але й для тих, хто користується інструментом без передплати.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Після оновлення можливості генерації зображення будуть значно кращими. Замість того, щоб використовувати окрему модель на кшталт Dall-E, новий вдосконалений генератор зображень стане частиною GPT-4o за замовчуванням. Тож користувачам більше не треба буде відкривати Dall-E щоразу, коли їм буде потрібно фото капібари, яка їсть рамен, сидячи на поверхні Марса. До речі, аналогічна функція з’явиться і в інструменті Sora.

На ринку є кілька моделей генерації зображень зі штучним інтелектом, які можуть створювати вражаючі сюрреалістичні сцени. Але всі вони не можуть створювати якісне зображення з текстом, логотипами та іншими звичайними елементами, що використовуються в повсякденному житті.
OpenAI стверджує, що нова функція генерації зображень у GPT-4o прибере ці недоліки, оскільки вона зможе точно відтворювати текст та слідувати підказкам завдяки великій базі знань та контексту чату. Також нова модель дозволятиме користувачам змінювати завантажені зображення або створювати нові, використовуючи завантажене зображення як референс.
Нова модель генерації зображень GPT-4o наразі вже доступна для користувачів ChatGPT Plus, Pro, Team і безкоштовної версії, а незабаром нею зможуть користуватися і власники ChatGPT Enterprise та Edu. Орієнтовно це станеться протягом найближчих тижнів. Користувачі можуть налаштувати формат зображень: вказати співвідношення сторін, точні кольори за допомогою шістнадцяткових кодів або прозорий фон.

Ця нова модель також доступна в Sora для створення зображень і через спеціальний DALL-E GPT. Для розробників генерація зображень за допомогою API GPT-4o буде доступна протягом наступних кількох тижнів.
Звісно, у моделі є певні обмеження. Наприклад, на генерацію може знадобитися до однієї хвилини, оскільки модель може створювати більш деталізовані зображення. Серед інших обмежень, які OpenAI виправлятиме протягом наступних тижнів і місяців, такі:
- Іноді вона може обрізати довгі зображення
- Може вигадувати інформацію, особливо якщо запропонувати низькоконтекстний запит
- Під час генерації зображень, що спираються на базу знань, модель може намагатися точно відтворити понад 10-20 різних понять одночасно
- Модель іноді має проблеми з відтворенням нелатинських мов, а символи можуть бути неточними у довгих складних написах
- Запити на редагування певних частин зображення, наприклад, друкарських помилок, не завжди ефективні та можуть змінити інші частини зображення
- Наразі модель не справляється із завданням відтворити детальну інформацію у дуже маленькому розмірі.

У компанії наголосили, що згенеровані зображення будуть супроводжуватися метаданими C2PA, а внутрішній інструмент OpenAI може перевірити, чи була картинка створена за допомогою цієї моделі.
Читайте також:
- Google запускає безкоштовну програму “Академія AI для освітян від Google”
- Суд відхилив запит Ілона Маска щодо OpenAI
