Meta vytvorila nový generátor založený na umelej inteligencii

Generátory textu na obrázok s umelou inteligenciou sa v posledných mesiacoch dostali na titulky novín, ale výskumníci už prešli na ďalšiu hranicu: generátory textu na video poháňané AI. Výskumníci z oblasti Meta takýto nový generátor verejne predstavili, uvádza The Verge.

Tím inžinierov strojového učenia Meta представила nový systém s názvom Make-A-Video. Tento model AI umožňuje používateľom zadať približný popis scény a vygeneruje krátke video, ktoré zodpovedá ich textu. Videá sú jasne umelé, s rozmazanými objektmi a skreslenými animáciami, no stále sú významným úspechom v oblasti generovania obsahu umelej inteligencie.

- Reklama -

Vo svojom príspevku na Facebook Generálny riaditeľ spoločnosti Meta Mark Zuckerberg opísal prácu ako „úžasný pokrok“ a dodal: „Vytvorenie videa je oveľa náročnejšie ako fotografie, pretože okrem správneho vygenerovania každého pixelu musí systém predpovedať aj to, ako sa budú časom meniť.“

Klipy netrvajú dlhšie ako päť sekúnd a neobsahujú žiadny zvuk, ale pokrývajú obrovské množstvo indícií. Aj keď je jasné, že video je generované počítačom, kvalita takýchto modelov AI sa v blízkej budúcnosti rýchlo zlepší. Len za pár rokov prešli generátory AI obrázkov od vytvárania takmer nezrozumiteľných obrázkov k fotorealistickému obsahu. A hoci pokrok vo videu môže byť pomalší vzhľadom na takmer neobmedzenú zložitosť predmetnej oblasti, ocenenie za bezproblémové generovanie videa bude motivovať mnohé organizácie a spoločnosti, aby do projektu investovali značné zdroje.

Spoločnosť tvrdí, že plánuje vydať demo verziu systému, ale neuviedla, kedy a ako bude implementovaná. V dokumente popisujúcom model výskumníci z Meta poznamenávajú, že Make-A-Video je trénované na pároch obrázkov a titulkov, ako aj na neoznačených videozáznamoch.

Obsah školenia bol odvodený z dvoch súborov údajov, WebVid-10M a HD-VILA-100M, ktoré spolu obsahujú milióny videí a zahŕňajú stovky tisíc hodín videozáznamov. Mimochodom, to zahŕňa aj stock zábery.

Vedci poznamenávajú, že model má okrem rozmazaných snímok a roztrúsených animácií mnoho technických obmedzení. Make-A-Video produkuje 16 snímok videa s rozlíšením 64 × 64 pixelov, ktorých veľkosť sa potom zmení pomocou samostatného modelu AI na 768 × 768 pixelov.

Môžete pomôcť Ukrajine v boji proti ruským útočníkom. Najlepším spôsobom, ako to urobiť, je darovať finančné prostriedky Ozbrojeným silám Ukrajiny prostredníctvom Zachrániť život alebo cez oficiálnu stránku NBU.

- Reklama -

Tiež zaujímavé:

Meta ukázala AI na vytváranie videí na základe popisu