Root NationНовиниIT новиниMeta показа AI за създаване на видеоклипове въз основа на описанието

Meta показа AI за създаване на видеоклипове въз основа на описанието

-

Генераторите на текст към изображение с изкуствен интелект (AI) правят заглавия през последните месеци, но изследователите вече са преминали към следващата граница: захранвани с AI генератори на текст към видео. Изследователите на Meta публично представиха такъв нов генератор, съобщава The Verge.

Инженерен екип на Meta за машинно обучение представени нова система, наречена Make-A-Video. Този AI модел позволява на потребителите да въведат грубо описание на сцената и генерира кратко видео, което съответства на техния текст. Видеата са очевидно изкуствени, с размазани обекти и изкривени анимации, но все пак са значително постижение в областта на генерирането на съдържание с изкуствен интелект.

Създаване на видео: AI

В публикацията си на Facebook Главният изпълнителен директор на Meta Марк Зукърбърг описа работата като „удивителен напредък“, добавяйки: „Създаването на видео е много по-трудно от снимките, защото в допълнение към правилното генериране на всеки пиксел, системата също трябва да предвиди как те ще се променят с времето.“

Създаване на видео: AI

Клиповете продължават не повече от пет секунди и не съдържат звук, но покриват огромен набор от улики. Въпреки че е ясно, че видеото е компютърно генерирано, качеството на такива AI модели бързо ще се подобри в близко бъдеще. Само за няколко години AI генераторите на изображения преминаха от създаване на почти неразбираеми картини до фотореалистично съдържание. И докато напредъкът във видеото може да е по-бавен предвид почти неограничената сложност на предметната област, наградата за безпроблемно генериране на видео ще мотивира много организации и компании да инвестират значителни ресурси в проекта.

Компанията казва, че планира да пусне демо версия на системата, но не каза кога и как ще бъде внедрена. В документ, описващ модела, изследователите на Meta отбелязват, че Make-A-Video се обучава върху двойки изображение-надпис, както и немаркирани видеозаписи.

Съдържанието на обучението е извлечено от два набора от данни, WebVid-10M и HD-VILA-100M, които заедно съдържат милиони видеоклипове и обхващат стотици хиляди часове видеозаписи. Между другото, това включва стокови кадри.

Изследователите отбелязват, че моделът има много технически ограничения, в допълнение към размазаните рамки и разпръснатите анимации. Make-A-Video извежда 16 видео кадъра с разделителна способност 64 × 64 пиксела, които след това се преоразмеряват с помощта на отделен AI модел до 768 × 768 пиксела.

Можете да помогнете на Украйна да се бори срещу руските нашественици. Най-добрият начин да направите това е да дарите средства на въоръжените сили на Украйна чрез Savelife или през официалната страница НБУ.

Също интересно:

Регистрирай се
Уведомете за
гост

0 Коментари
Вградени рецензии
Вижте всички коментари