Meta je ustvarila nov generator, ki temelji na umetni inteligenci

Generatorji besedila v sliko z umetno inteligenco (AI) so v zadnjih mesecih polnili naslovnice, vendar so raziskovalci že prešli na naslednjo mejo: generatorji besedila v video, ki jih poganja AI. Raziskovalci Meta so javno predstavili takšen nov generator, poroča The Verge.

Metina ekipa inženirjev za strojno učenje predstavljeno nov sistem, imenovan Make-A-Video. Ta model umetne inteligence omogoča uporabnikom, da vnesejo grob opis prizora, in ustvari kratek video, ki se ujema z njihovim besedilom. Videoposnetki so očitno umetni, z zamegljenimi predmeti in popačenimi animacijami, a vseeno pomemben dosežek na področju generiranja vsebin z umetno inteligenco.

V svoji objavi na Facebook Izvršni direktor Mete Mark Zuckerberg je delo opisal kot "neverjeten napredek" in dodal: "Video je veliko težje ustvariti kot fotografije, saj mora sistem poleg pravilnega generiranja vsakega piksla predvideti tudi, kako se bodo spreminjali skozi čas."

Make-A-Video: AI

Posnetki ne trajajo več kot pet sekund in ne vsebujejo zvoka, vendar pokrivajo ogromno namigov. Čeprav je jasno, da je video posnetek računalniško ustvarjen, se bo kakovost takšnih modelov AI v bližnji prihodnosti hitro izboljšala. V samo nekaj letih so generatorji slik z umetno inteligenco prešli iz ustvarjanja skoraj nerazumljivih slik v fotorealistične vsebine. In čeprav je napredek pri videu morda počasnejši glede na skoraj neomejeno kompleksnost predmetnega področja, bo nagrada za brezhibno ustvarjanje videa motivirala številne organizacije in podjetja, da vložijo znatna sredstva v projekt.

Podjetje pravi, da namerava izdati demo različico sistema, vendar ni povedalo, kdaj in kako bo implementirana. V prispevku, ki opisuje model, raziskovalci Mete ugotavljajo, da se Make-A-Video usposablja na parih slika-napis, pa tudi na neoznačenih video posnetkih.

Vsebina usposabljanja je bila pridobljena iz dveh naborov podatkov, WebVid-10M in HD-VILA-100M, ki skupaj vsebujeta milijone videoposnetkov in zajemata več sto tisoč ur videoposnetkov. Mimogrede, to vključuje posnetke.

Raziskovalci ugotavljajo, da ima model številne tehnične omejitve, poleg zamegljenih okvirjev in razpršenih animacij. Make-A-Video odda 16 sličic videa v ločljivosti 64 × 64 slikovnih pik, ki se nato z uporabo ločenega modela AI spremenijo v 768 × 768 slikovnih pik.

Lahko pomagate Ukrajini v boju proti ruskim okupatorjem. Najboljši način za to je donacija sredstev oboroženim silam Ukrajine prek Savelife ali preko uradne strani NBU.

Zanimivo tudi:

Jereloprestopiti

Prijavite se

0 Komentarji

Vdelana mnenja

Prikaži vse komentarje

Drugi članki

Meta je pokazala AI za ustvarjanje videoposnetkov na podlagi opisa

Nedavni komentarji