Google няма голям опит, когато става въпрос за създаване на изображения с изкуствен интелект. Ново избухна скандал поради генератор на изображения, вграден в Gemini, който неправилно създава изображения на хора, бъркайки тяхната раса. След много оплаквания технологичният гигант премахна функцията за генериране на лица и я изпрати "за ремонт". Докато чакаме, компанията пусна подобрен инструмент за изображения Imagen 2 като част от своята платформа за разработчици Vertex AI. Има обаче нюанс - инструментът все още е фокусиран върху бизнеса.

Imagen 2 може да създава и редактира изображения с текстови подкани, подобно на DALL-E и Midjourney. Инструментът може да показва текст, емблеми и лога на множество езици, като по избор наслагва тези елементи върху съществуващи изображения като визитни картички, дрехи и продукти.

След първото стартиране в режим на преглед, редактирането на изображения с Imagen 2 вече е достъпно във Vertex AI заедно с две нови възможности: рисуване и оцветяване. Функциите за рисуване и оцветяване, които отдавна се предлагат от други популярни генератори на изображения, включително DALL-E, могат да се използват за премахване на нежелани части от изображението, добавяне на нови компоненти и разширяване на границите на изображението, за да се създаде по-широко поле от изглед.

Но истинското надграждане на Imagen 2 е това Google нарича "трансформиране на текст в живи изображения". Инструментът вече може да създава 4-секундни видеоклипове от текстови подкани, подобно на работещите с AI инструменти за създаване на клипове. В съответствие с корпоративния фокус на модела, Google предлага живи изображения като инструмент за търговци и творци, като GIF генератор за реклама, която показва природа, храна и животни – теми, за които Imagen 2 е перфектно обучен.

Google твърди, че изображенията на живо могат да уловят "различни ъгли и движения", като същевременно "запазят последователност". Но засега те имат ниска резолюция: 360x640 и компанията обеща, че това ще се подобри в бъдеще.

За да намали притесненията относно възможността за deepfakes, Google каза, че Imagen 2 ще използва специална технология SynthID, разработена от Google DeepMind, за да прилага невидими криптографски водни знаци към живи изображения. Те са устойчиви на редактиране, включително компресиране, филтри и корекции на цветовия тон, но изискват отделен инструмент за откриването им.

Също Google подчертава, че генерирането на живи изображения "ще бъде тествано за целите на сигурността". „Моделът Imagen 2 във Vertex AI не изпита същите проблеми като приложението Gemini. Продължаваме активно да тестваме и взаимодействаме с нашите клиенти“, отбелязаха представители на компанията.

Прочетете също:

DzhereloTechCrunch

Регистрирай се

0 Коментари

Вградени рецензии

Вижте всички коментари

Други статии

AI инструментът на Google Imagen 2 вече може да създава 4-секундни видеоклипове

Последни коментари