Meta telah membuat generator baru berdasarkan kecerdasan buatan

Pembuat teks-ke-gambar kecerdasan buatan (AI) telah menjadi berita utama dalam beberapa bulan terakhir, tetapi para peneliti telah pindah ke perbatasan berikutnya: generator teks-ke-video bertenaga AI. Peneliti meta telah secara terbuka mempresentasikan generator baru seperti itu, The Verge melaporkan.

Tim teknik pembelajaran mesin Meta disajikan sistem baru yang disebut Make-A-Video. Model AI ini memungkinkan pengguna untuk memasukkan deskripsi kasar dari adegan, dan menghasilkan video pendek yang cocok dengan teks mereka. Video-video tersebut jelas buatan, dengan objek buram dan animasi yang terdistorsi, tetapi masih merupakan pencapaian yang signifikan di bidang pembuatan konten kecerdasan buatan.

Dalam postingannya di Facebook CEO Meta Mark Zuckerberg menggambarkan pekerjaan itu sebagai "kemajuan yang luar biasa", menambahkan: "Video jauh lebih sulit dibuat daripada foto, karena selain menghasilkan setiap piksel dengan benar, sistem juga harus memprediksi bagaimana mereka akan berubah seiring waktu."

Buat Video: AI

Klip berlangsung tidak lebih dari lima detik dan tidak mengandung suara, tetapi mencakup sejumlah besar petunjuk. Meskipun jelas bahwa video tersebut dihasilkan oleh komputer, kualitas model AI semacam itu akan meningkat pesat dalam waktu dekat. Hanya dalam beberapa tahun, pembuat gambar AI telah beralih dari membuat gambar yang hampir tidak dapat dipahami menjadi konten fotorealistik. Dan sementara kemajuan dalam video mungkin lebih lambat mengingat kompleksitas area subjek yang hampir tak terbatas, penghargaan untuk pembuatan video tanpa batas akan memotivasi banyak organisasi dan perusahaan untuk menginvestasikan sumber daya yang signifikan dalam proyek tersebut.

Perusahaan mengatakan berencana untuk merilis versi demo dari sistem, tetapi belum mengatakan kapan atau bagaimana itu akan diimplementasikan. Dalam sebuah makalah yang menjelaskan model tersebut, para peneliti Meta mencatat bahwa Make-A-Video dilatih pada pasangan gambar-teks serta rekaman video yang tidak berlabel.

Konten pelatihan berasal dari dua kumpulan data, WebVid-10M dan HD-VILA-100M, yang bersama-sama berisi jutaan video dan mencakup ratusan ribu jam rekaman video. Omong-omong, ini termasuk rekaman stok.

Para peneliti mencatat bahwa model ini memiliki banyak keterbatasan teknis, selain bingkai buram dan animasi yang tersebar. Make-A-Video menghasilkan 16 frame video pada resolusi 64x64 piksel, yang kemudian diubah ukurannya menggunakan model AI terpisah menjadi 768x768 piksel.

Anda dapat membantu Ukraina melawan penjajah Rusia. Cara terbaik untuk melakukannya adalah dengan menyumbangkan dana ke Angkatan Bersenjata Ukraina melalui selamatkan hidup atau melalui halaman resmi NBU.

Juga menarik:

Jerelotheverge

Daftar

0 komentar

Ulasan Tertanam

Lihat semua komentar

Artikel lainnya

Meta menunjukkan AI untuk membuat video berdasarkan deskripsi

Komentar terbaru