AI-інструменти Google поступово починають отримувати деякі з тих покращень, які компанія анонсувала на конференції Google I/O. Вже цього тижня техногігант представить генератор зображень Imagen нового покоління, який повертає можливість генерувати зображення людей. Нагадаю, на початку року ми писали про скандал навколо цих зображень. Крім того, чат-бот Gemini від Google також додає Gem – ботів з індивідуальними налаштуваннями, подібних до користувацьких GPT від ChatGPT.
Imagen 3 від Google – це оновлена версія генератора зображень. У компанії говорять, що AI-модель наступного покоління “встановлює новий стандарт якості зображень” і побудована з обмеженнями, щоб уникнути надмірної корекції різноманіття, як, наприклад, дивні “історичні AI-зображення”, які стали вірусними на початку року.
“У широкому діапазоні тестів Imagen 3 демонструє кращі результати порівняно з іншими доступними моделями генерації зображень”, – говорить менеджер по продуктах Gemini Дейв Цитрон. За його словами, інструмент дозволяє керувати процесом генерації зображень за допомогою додаткових підказок, якщо вам не подобається те, що він видає з першого разу. Він додав, що Imagen 3 “вигідно відрізняється” від конкурентів і містить інструмент SynthID для накладання водяних знаків на зображення, щоб було зрозуміло, що вони створені штучним інтелектом.
Також Дейв Цитрон зазначив, що нові методи запобігатимуть створенню “фотореалістичних, ідентифікованих особистостей”, тобто це далеко від проблемних діпфейків, які генерує Grok Ілона Маска. Також під забороною перебувають зображення дітей та, як і в інших генераторах, будь-які криваві, насильницькі або сексуальні сцени. Він уточнив, що зображення Gemini не будуть ідеальними, але пообіцяв, що компанія прислухатиметься до відгуків і вдосконалюватиметься відповідно до них.
Починаючи з цього тижня, модель Imagen 3 буде доступна для всіх користувачів, але генерування зображень людей буде спочатку доступно тим, у кого є активна передплата. Англомовні користувачі Gemini Advanced, Business і Enterprise можуть очікувати, що генерація зображень людей повернеться «найближчими днями».
Gem – це кастомні чат-боти Google зі створеними користувачем інструкціями. По суті, це відповідь Gemini на різні GPT від OpenAI, які конкурент Google запустив наприкінці минулого року. Gem розгортатимуть в найближчі кілька днів.
“За допомогою Gem ви можете створити команду експертів, які допоможуть вам продумати складний проєкт, провести мозковий штурм ідей для майбутньої події або написати ідеальний підпис для посту в соціальних мережах, – повідомив Дейв Цитрон. – Ваш Gem також може запам’ятати детальний набір інструкцій, щоб допомогти вам заощадити час на нудних, повторюваних або складних завданнях”.
Їх можна зробити з нуля, але Gemini пропонуватиме готових ботів, які “допоможуть вам розпочати роботу”. Серед готових є:
- “Коуч”, який допоможе розібратися в складних темах
- “Мозковий штурм” для натхнення
- “Кар’єрний гід”, який допоможе підвищити кваліфікацію, прийняти рішення та поставити цілі
- “Редактор текстів”, що надає конструктивні поради щодо граматики, тональності та структури
- “Партнер з кодування”, який покращить навички кодування і надихне на нові проєкти.
Gem починають розгортатися вже сьогодні на десктопних та мобільних пристроях. Однак вони доступні лише для передплатників Gemini Advanced, Business та Enterprise.
Якщо вам цікаві статті та новини про авіацію та космічну техніку — запрошуємо вас на наш новий проєкт AERONAUT.media.
Читайте також: