Мета создаде нов генератор базиран на вештачка интелигенција

Генераторите на текст-во-слика со вештачка интелигенција (АИ) станаа насловни страници во последниве месеци, но истражувачите веќе преминаа на следната граница: генератори на текст-во-видео напојувани со вештачка интелигенција. Истражувачите на Мета јавно претставија таков нов генератор, пишува The Verge.

Инженерскиот тим на Мета за машинско учење презентирани нов систем наречен Make-A-Video. Овој модел на вештачка интелигенција им овозможува на корисниците да внесат груб опис на сцената и генерира кратко видео што одговара на нивниот текст. Видеата се јасно вештачки, со заматени објекти и искривени анимации, но сепак се значајно достигнување на полето на генерирање содржини од вештачка интелигенција.

Во својот пост на Facebook Извршниот директор на Мета, Марк Закерберг, ја опиша работата како „неверојатен напредок“, додавајќи: „Видеото е многу потешко да се создаде од фотографиите, бидејќи покрај правилното генерирање на секој пиксел, системот треба да предвиди и како тие ќе се променат со текот на времето“.

Make-A-Video: AI

Клиповите траат не повеќе од пет секунди и не содржат звук, но опфаќаат огромен опсег на индиции. Иако е јасно дека видеото е генерирана од компјутер, квалитетот на таквите модели со вештачка интелигенција брзо ќе се подобри во блиска иднина. За само неколку години, генераторите на слики со вештачка интелигенција од создавање речиси неразбирливи слики преминаа во фотореалистична содржина. И додека напредокот во видеото може да биде побавен со оглед на речиси неограничената сложеност на предметната област, наградата за беспрекорно генерирање видео ќе мотивира многу организации и компании да инвестираат значителни ресурси во проектот.

Компанијата вели дека планира да објави демо верзија на системот, но не кажа кога и како ќе се имплементира. Во трудот што го опишува моделот, истражувачите на Мета забележуваат дека Make-A-Video е обучен на парови слика-наслов, како и видео снимки без ознака.

Содржината за обука беше изведена од две сетови на податоци, WebVid-10M и HD-VILA-100M, кои заедно содржат милиони видеа и опфаќаат стотици илјади часови видео снимки. Патем, ова вклучува снимки од акции.

Истражувачите забележуваат дека моделот има многу технички ограничувања, покрај заматените рамки и расфрланите анимации. Make-A-Video емитува 16 фрејмови видео со резолуција од 64×64 пиксели, кои потоа се менуваат со помош на посебен модел со вештачка интелигенција на 768×768 пиксели.

Можете да и помогнете на Украина да се бори против руските напаѓачи. Најдобар начин да го направите ова е да донирате средства за вооружените сили на Украина преку Савелифе или преку официјалната страница Bвезди.

Исто така интересно:

Jereloприближуваат

Пријавете се

0 коментари

Вградени критики

Прикажи ги сите коментари

Други статии

Мета покажа вештачка интелигенција за создавање видеа врз основа на описот

Неодамнешни коментари