Meta a creat un nou generator bazat pe inteligența artificială

Generatoarele de text-to-image din inteligență artificială au făcut titluri în ultimele luni, dar cercetătorii au trecut deja la următoarea frontieră: generatoarele de text-to-video alimentate de AI. Cercetătorii Meta au prezentat public un astfel de generator nou, relatează The Verge.

Echipa de inginerie de învățare automată a lui Meta prezentat un nou sistem numit Make-A-Video. Acest model AI permite utilizatorilor să introducă o descriere aproximativă a scenei și generează un videoclip scurt care se potrivește cu textul lor. Videoclipurile sunt clar artificiale, cu obiecte neclare și animații distorsionate, dar sunt totuși o realizare semnificativă în domeniul generării de conținut de inteligență artificială.

În postarea sa de pe Facebook CEO-ul Meta, Mark Zuckerberg, a descris lucrarea drept un „avans uimitor”, adăugând: „Videoclipul este mult mai dificil de creat decât fotografiile, deoarece, pe lângă generarea corectă a fiecărui pixel, sistemul trebuie să prezică și modul în care se vor schimba în timp”.

Faceți un videoclip: AI

Clipurile nu durează mai mult de cinci secunde și nu conțin sunet, dar acoperă o gamă largă de indicii. Deși este clar că videoclipul este generat de computer, calitatea unor astfel de modele AI se va îmbunătăți rapid în viitorul apropiat. În doar câțiva ani, generatoarele de imagini AI au trecut de la crearea de imagini aproape de neînțeles la conținut fotorealist. Și în timp ce progresul în domeniul video poate fi mai lent, având în vedere complexitatea aproape nelimitată a domeniului subiectului, premiul pentru generarea fără întreruperi video va motiva multe organizații și companii să investească resurse semnificative în proiect.

Compania spune că intenționează să lanseze o versiune demo a sistemului, dar nu a spus când sau cum va fi implementat. Într-o lucrare care descrie modelul, cercetătorii Meta notează că Make-A-Video este instruit pe perechi imagine-titlu, precum și pe înregistrări video neetichetate.

Conținutul de instruire a fost derivat din două seturi de date, WebVid-10M și HD-VILA-100M, care împreună conțin milioane de videoclipuri și acoperă sute de mii de ore de filmări video. Apropo, aceasta include materialul de stocare.

Cercetătorii notează că modelul are multe limitări tehnice, pe lângă cadrele neclare și animațiile împrăștiate. Make-A-Video produce 16 cadre video la o rezoluție de 64×64 pixeli, care sunt apoi redimensionate folosind un model AI separat la 768×768 pixeli.

Poți ajuta Ucraina să lupte împotriva invadatorilor ruși. Cel mai bun mod de a face acest lucru este să donați fonduri Forțelor Armate ale Ucrainei prin intermediul Salveaza viata sau prin pagina oficiala NBU.

Interesant de asemenea:

Dzherelomarginea

Inscrie-te

0 Comentarii

Recenzii încorporate

Vezi toate comentariile

Alte articole

Meta a arătat AI pentru crearea videoclipurilor pe baza descrierii

Comentarii recente