Root NationNaujienosIT naujienosMeta parodė AI vaizdo įrašams kurti pagal aprašymą

Meta parodė AI vaizdo įrašams kurti pagal aprašymą

-

Dirbtinio intelekto (AI) teksto į vaizdą generatoriai pastaraisiais mėnesiais pateko į antraštes, tačiau mokslininkai jau perėjo prie kitos ribos: dirbtinio intelekto maitinami teksto į vaizdo generatoriai. Meta tyrinėtojai viešai pristatė tokį naują generatorių, skelbia „The Verge“.

Meta mašininio mokymosi inžinierių komanda pateiktas nauja sistema, pavadinta Make-A-Video. Šis AI modelis leidžia vartotojams įvesti apytikslį scenos aprašymą ir sugeneruoja trumpą vaizdo įrašą, atitinkantį jų tekstą. Vaizdo įrašai yra aiškiai dirbtiniai, su neryškiais objektais ir iškreipta animacija, tačiau vis tiek yra reikšmingas pasiekimas dirbtinio intelekto turinio generavimo srityje.

Vaizdo įrašas: AI

Savo įraše apie Facebook „Meta“ generalinis direktorius Markas Zuckerbergas apibūdino darbą kaip „nuostabų pažangą“ ir pridūrė: „Vaizdo įrašą sukurti yra daug sunkiau nei nuotraukas, nes sistema ne tik teisingai generuoja kiekvieną pikselį, bet ir turi numatyti, kaip jie keisis laikui bėgant“.

Vaizdo įrašas: AI

Klipai trunka ne ilgiau kaip penkias sekundes ir juose nėra garso, tačiau jie apima daugybę užuominų. Nors akivaizdu, kad vaizdo įrašas sukurtas kompiuteriu, tokių AI modelių kokybė artimiausiu metu sparčiai gerės. Vos per kelerius metus dirbtinio intelekto vaizdų generatoriai iš beveik nesuprantamų paveikslėlių kūrimo tapo fotorealistišku turiniu. Ir nors vaizdo įrašų pažanga gali būti lėtesnė dėl beveik neriboto dalykinės srities sudėtingumo, apdovanojimas už vientisą vaizdo įrašų generavimą paskatins daugelį organizacijų ir įmonių investuoti į projektą daug išteklių.

Bendrovė teigia, kad planuoja išleisti demonstracinę sistemos versiją, tačiau nepasakė, kada ir kaip ji bus įdiegta. Straipsnyje, kuriame aprašomas modelis, „Meta“ tyrėjai pažymi, kad „Make-A-Video“ yra apmokytas vaizdo antraštės poromis, taip pat nepažymėta vaizdo medžiaga.

Mokymo turinys buvo gautas iš dviejų duomenų rinkinių – WebVid-10M ir HD-VILA-100M, kuriuose kartu yra milijonai vaizdo įrašų ir apimantys šimtus tūkstančių valandų vaizdo įrašo. Beje, tai apima ir standartinę filmuotą medžiagą.

Tyrėjai pažymi, kad modelis turi daug techninių apribojimų, be neryškių kadrų ir išsibarsčiusių animacijų. „Make-A-Video“ išveda 16 kadrų vaizdo įrašo, kurio skiriamoji geba yra 64 × 64 pikselių, kurių dydis vėliau pakeičiamas naudojant atskirą AI modelį iki 768 × 768 pikselių.

Jūs galite padėti Ukrainai kovoti su Rusijos įsibrovėliais. Geriausias būdas tai padaryti – aukoti lėšas Ukrainos ginkluotosioms pajėgoms per Išgelbėk gyvybę arba per oficialų puslapį NBU.

Taip pat įdomu:

Jerelaspagauti
Registruotis
Pranešti apie
svečias

0 komentarai
Įterptieji atsiliepimai
Žiūrėti visus komentarus