Root NationXəbərlərİT xəbərləriMeta təsvir əsasında videolar yaratmaq üçün süni intellekt göstərdi

Meta təsvir əsasında videolar yaratmaq üçün süni intellekt göstərdi

-

Süni intellektin (AI) mətndən görüntüyə generatorları son aylarda başlıqlara çevrilir, lakin tədqiqatçılar artıq növbəti sərhədə keçiblər: süni intellektlə işləyən mətndən videoya generatorlar. Meta tədqiqatçıları belə yeni generatoru ictimaiyyətə təqdim ediblər, The Verge yazır.

Meta-nın maşın öyrənmə mühəndisliyi komandası təqdim Make-A-Video adlı yeni sistem. Bu AI modeli istifadəçilərə səhnənin təxmini təsvirini daxil etməyə imkan verir və onların mətninə uyğun qısa video yaradır. Videolar aydın şəkildə sünidir, bulanıq obyektlər və təhrif olunmuş animasiyalar, lakin hələ də süni intellekt məzmununun yaradılması sahəsində mühüm nailiyyətdir.

- Reklam -

haqqındakı yazısında Facebook Meta şirkətinin baş direktoru Mark Zukerberq işi “möcüzəli irəliləyiş” kimi qiymətləndirərək əlavə etdi: “Video yaratmaq fotolardan qat-qat çətindir, çünki sistem hər pikseli düzgün yaratmaqla yanaşı, onların zamanla necə dəyişəcəyini də proqnozlaşdırmalıdır”.

Kliplər beş saniyədən çox davam etmir və heç bir səs ehtiva etmir, lakin çox sayda ipucunu əhatə edir. Videonun kompüter tərəfindən yaradıldığı aydın olsa da, bu cür AI modellərinin keyfiyyəti yaxın gələcəkdə sürətlə yaxşılaşacaq. Cəmi bir neçə il ərzində AI görüntü generatorları demək olar ki, anlaşılmaz şəkillər yaratmaqdan fotoreal məzmuna keçdi. Mövzu sahəsinin demək olar ki, sonsuz mürəkkəbliyini nəzərə alaraq videoda irəliləyiş daha yavaş ola bilsə də, qüsursuz video yaratmaq üçün mükafat bir çox təşkilat və şirkətləri layihəyə əhəmiyyətli resurslar yatırmağa sövq edəcək.

Şirkət sistemin demo versiyasını buraxmağı planlaşdırdığını deyir, lakin onun nə vaxt və necə tətbiq ediləcəyini açıqlamayıb. Modeli təsvir edən bir məqalədə Meta tədqiqatçıları qeyd edirlər ki, Make-A-Video şəkil-başlıq cütləri, eləcə də etiketsiz video görüntüləri üzərində öyrədilir.

Təlim məzmunu birlikdə milyonlarla videonu ehtiva edən və yüz minlərlə saatlıq video çəkilişləri əhatə edən WebVid-10M və HD-VILA-100M adlı iki məlumat dəstindən əldə edilmişdir. Yeri gəlmişkən, bura stok görüntüləri də daxildir.

Tədqiqatçılar qeyd edirlər ki, model bulanıq kadrlar və səpələnmiş animasiyalardan başqa bir çox texniki məhdudiyyətlərə malikdir. Make-A-Video 16×64 piksel təsvir ölçülü 64 kadr videonu çıxarır, daha sonra ayrı AI modelindən istifadə edərək ölçüsünü 768×768 pikselə dəyişdirir.

Siz Ukraynaya rus işğalçılarına qarşı mübarizədə kömək edə bilərsiniz. Bunun ən yaxşı yolu Ukrayna Silahlı Qüvvələrinə pul köçürməkdir Savelife və ya rəsmi səhifə vasitəsilə NBU.

- Reklam -

Həmçinin maraqlıdır: