За останні місяці зусилля Google та OpenAI привернули до себе багато уваги, але компанія Meta вважає, що її нова розробка може стати однією з найкращих, принаймні, коли мова йдеться про створення штучного інтелекту в галузі мистецтва. Компанія щойно запустила “CM3leon” (“Хамелеон”) — генератор зображень, який може перетворювати текстові підказки на картинки та навпаки. Згідно із заявою на сайті Meta, CM3leon – це “перша мультимодальна модель, навчена за допомогою алгоритму, адаптованого за допомогою текстових мовних моделей”. Завдяки цьому, за словами Meta, модель досягає “найвищої продуктивності при перетворенні тексту в зображення, незважаючи на те, що вона навчається за допомогою обчислень, якi в п’ять разів меншi, ніж попередні методи, засновані на трансформації”.
Простіше кажучи, ви можете використовувати новий ШI для створення нових складних зображень з нуля або для редагування вже існуючих. Редагування може включати перетворення літа на зиму, зміну кольору неба чи будь-що інше. Що стосується згенерованих зображень, то межi немає, окрім вашої уяви. Користувачі також можуть додати зображення і поставити ШІ-моделі запитання про нього, чи то запит про конкретні аспекти фотографії, чи навіть попросити модель створити детальний опис зображення. Інші підтримувані функції включають об’єкт зображення, сегментацію зображення та додавання етапу “надвисокої роздільної здатності”, який збільшує роздільну здатність створених зображень.
Генератор зображень Meta, безумовно, унікальний, і робить свою справу дуже добре, але це далеко не єдина розробка на даний момент. Подібні рішення вже давно існують, і більшість провідних розробників мають їх у тій чи іншій формі. DALL-E від OpenAI потрапив у заголовки минулого року, з’явився у кількох формах і має велику кількість прихильників. Модель GPT-4 компанії також здатна генерувати зображення, хоча для використання веб-інструменту OpenAI потрібен плагін. Adobe також швидко додала штучний інтелект до свого набору послуг. Firefly, генеративна модель ШІ компанії, доступна для використання безкоштовно, але передплатники отримують доступ до бібліотеки фотографій Adobe і, таким чином, до більш ефективної версії інструменту ШІ, який на ній базується. Google Bard також використовує Firefly для генерації зображень. Далі йдуть потужні інструменти, які потребують певної пiдготовки, щоб їх запустити, і бiльш детальних підказок, якщо ви хочете ефективно ними користуватися. До цієї категорії належать такі інструменти, як Stable Diffusion та Midjourney.
Щодо того, коли ви зможете спробувати новий інструмент від Meta, ми не знаємо. Компанія не повідомила, коли відбудеться його публічний реліз. Безумовно, у Meta і без того вистачає проблем, пов’язаних із запуском нової соціальної платформи Threads і неухильним крахом “Метавсесвіту”, але ми сподіваємося, що новий генератор зображень зі штучним інтелектом буде випущений у найближчі кілька тижнів.
Читайте також: