Meta vytvořila nový generátor založený na umělé inteligenci

Generátory textu na obrázek s umělou inteligencí (AI) se v posledních měsících dostaly do novinových titulků, ale výzkumníci již přešli na další hranici: generátory textu na video poháněné umělou inteligencí. Výzkumníci Meta takový nový generátor veřejně představili, uvádí The Verge.

Tým inženýrů strojového učení Meta prezentovány nový systém nazvaný Make-A-Video. Tento model AI umožňuje uživatelům zadat hrubý popis scény a generuje krátké video, které odpovídá jejich textu. Videa jsou jasně umělá, s rozmazanými objekty a zkreslenými animacemi, ale stále jsou významným počinem na poli generování obsahu umělé inteligence.

Ve svém příspěvku na Facebook Generální ředitel společnosti Meta Mark Zuckerberg popsal práci jako „úžasný pokrok“ a dodal: „Vytváření videa je mnohem obtížnější než fotografie, protože kromě správného generování každého pixelu musí systém také předvídat, jak se budou v průběhu času měnit.“

Make-A-Video: AI

Klipy netrvají déle než pět sekund a neobsahují žádný zvuk, ale pokrývají širokou škálu vodítek. I když je jasné, že video je generováno počítačem, kvalita takových modelů AI se v blízké budoucnosti rychle zlepší. Za pouhých pár let přešly generátory AI obrázků od vytváření téměř nesrozumitelných obrázků k fotorealistickému obsahu. A zatímco pokrok ve videu může být pomalejší vzhledem k téměř neomezené složitosti předmětné oblasti, ocenění za bezproblémové generování videa bude motivovat mnoho organizací a společností, aby do projektu investovaly značné prostředky.

Společnost říká, že plánuje vydat demo verzi systému, ale neřekla, kdy a jak bude implementována. V dokumentu popisujícím model výzkumníci z Meta poznamenávají, že Make-A-Video je trénováno na párech obrázek-titulek a také na neoznačených videozáznamech.

Obsah školení byl odvozen ze dvou datových sad, WebVid-10M a HD-VILA-100M, které dohromady obsahují miliony videí a pokrývají stovky tisíc hodin videozáznamu. Mimochodem, to zahrnuje i stock záběry.

Výzkumníci poznamenávají, že model má kromě rozmazaných snímků a rozházených animací mnoho technických omezení. Make-A-Video poskytuje výstup 16 snímků videa v rozlišení 64 × 64 pixelů, které jsou následně změněny pomocí samostatného modelu AI na 768 × 768 pixelů.

Můžete pomoci Ukrajině v boji proti ruským vetřelcům. Nejlepším způsobem, jak toho dosáhnout, je darovat finanční prostředky ozbrojeným silám Ukrajiny prostřednictvím Zachraňte život nebo přes oficiální stránku NBÚ.

Zajímavé také:

Dzhereloodvrátit

Přihlásit se

0 Komentáře

Vložené recenze

Zobrazit všechny komentáře

Další články

Meta ukázala AI pro vytváření videí na základě popisu

Nedávné Komentáře