Root NationსიახლეებიIT სიახლეებიმეტამ აჩვენა AI აღწერილობის საფუძველზე ვიდეოების შესაქმნელად

მეტამ აჩვენა AI აღწერილობის საფუძველზე ვიდეოების შესაქმნელად

-

ხელოვნური ინტელექტის (AI) ტექსტიდან გამოსახულების გენერატორები სათაურებია ბოლო თვეების განმავლობაში, მაგრამ მკვლევარები უკვე გადავიდნენ შემდეგ ზღვარზე: AI-ზე მომუშავე ტექსტი ვიდეო გენერატორები. Meta-ს მკვლევარებმა საჯაროდ წარმოადგინეს ასეთი ახალი გენერატორი, იუწყება The Verge.

მეტას მანქანათმცოდნეობის ინჟინერიის გუნდი წარმოდგენილი ახალი სისტემა სახელად Make-A-Video. ხელოვნური ინტელექტის ეს მოდელი მომხმარებლებს საშუალებას აძლევს შეიყვანონ სცენის უხეში აღწერა და ის ქმნის მოკლე ვიდეოს, რომელიც შეესაბამება მათ ტექსტს. ვიდეოები აშკარად ხელოვნურია, ბუნდოვანი ობიექტებით და დამახინჯებული ანიმაციებით, მაგრამ მაინც მნიშვნელოვანი მიღწევაა ხელოვნური ინტელექტის კონტენტის გენერირების სფეროში.

- რეკლამა -

თავის პოსტში Facebook Meta-ს აღმასრულებელმა დირექტორმა მარკ ცუკერბერგმა შეაფასა ნამუშევარი, როგორც "საოცარი წინსვლა" და დასძინა: "ვიდეოს შექმნა ბევრად უფრო რთულია, ვიდრე ფოტოები, რადგან თითოეული პიქსელის სწორად გენერირების გარდა, სისტემას ასევე უნდა წინასწარ განსაზღვროს, თუ როგორ შეიცვლება ისინი დროთა განმავლობაში."

კლიპები გრძელდება არაუმეტეს ხუთი წამისა და არ შეიცავს ხმას, მაგრამ მოიცავს მინიშნებების უზარმაზარ დიაპაზონს. მიუხედავად იმისა, რომ აშკარაა, რომ ვიდეო კომპიუტერულად არის შექმნილი, ასეთი AI მოდელების ხარისხი სწრაფად გაუმჯობესდება უახლოეს მომავალში. სულ რამდენიმე წელიწადში, AI გამოსახულების გენერატორები თითქმის გაუგებარი სურათების შექმნიდან ფოტორეალისტურ შინაარსზე გადავიდნენ. და მიუხედავად იმისა, რომ ვიდეოში პროგრესი შეიძლება იყოს უფრო ნელი, თუ გავითვალისწინებთ თემის თითქმის უსაზღვრო სირთულის, ჯილდო უწყვეტი ვიდეო გენერირებისთვის მოტივაციას გაუწევს ბევრ ორგანიზაციას და კომპანიას, ჩადონ პროექტში მნიშვნელოვანი რესურსები.

კომპანია აცხადებს, რომ გეგმავს სისტემის დემო ვერსიის გამოშვებას, მაგრამ არ უთქვამს როდის და როგორ განხორციელდება. ქაღალდში, რომელიც აღწერს მოდელს, Meta-ს მკვლევარები აღნიშნავენ, რომ Make-A-Video გაწვრთნილი იყო გამოსახულების წარწერის წყვილებზე, ისევე როგორც არალეიბლირებულ ვიდეო კადრებზე.

ტრენინგის შინაარსი მიღებული იყო ორი მონაცემთა ნაკრებიდან, WebVid-10M და HD-VILA-100M, რომლებიც ერთად შეიცავს მილიონობით ვიდეოს და მოიცავს ასობით ათასი საათის ვიდეო კადრებს. სხვათა შორის, ეს მოიცავს საფონდო კადრებს.

მკვლევარები აღნიშნავენ, რომ მოდელს აქვს მრავალი ტექნიკური შეზღუდვა, გარდა ბუნდოვანი ჩარჩოებისა და გაფანტული ანიმაციისა. Make-A-Video გამოსცემს ვიდეოს 16 კადრს 64×64 პიქსელის გარჩევადობით, რომლებიც შემდეგ იცვლება 768×768 პიქსელამდე ცალკე AI მოდელის გამოყენებით.

თქვენ შეგიძლიათ დაეხმაროთ უკრაინას რუსი დამპყრობლების წინააღმდეგ ბრძოლაში. ამის საუკეთესო გზაა უკრაინის შეიარაღებული ძალებისთვის თანხების შემოწირულობა Savelife ან ოფიციალური გვერდის საშუალებით NBU.

- რეკლამა -

ასევე საინტერესოა: