متا یک ژنراتور جدید مبتنی بر هوش مصنوعی ایجاد کرده است

مولدهای تبدیل متن به تصویر هوش مصنوعی (AI) در ماه‌های اخیر خبرساز شده‌اند، اما محققان در حال حاضر به سراغ مرز بعدی رفته‌اند: تولیدکننده‌های متن به تصویر با هوش مصنوعی. The Verge گزارش می دهد که محققان متا به طور عمومی چنین ژنراتور جدیدی را ارائه کرده اند.

تیم مهندسی یادگیری ماشین متا ارایه شده یک سیستم جدید به نام Make-A-Video. این مدل هوش مصنوعی به کاربران این امکان را می دهد تا توصیفی تقریبی از صحنه را وارد کنند و ویدیوی کوتاهی تولید می کند که با متن آنها مطابقت دارد. ویدیوها به وضوح مصنوعی، با اشیاء تار و انیمیشن های تحریف شده هستند، اما همچنان یک دستاورد قابل توجه در زمینه تولید محتوای هوش مصنوعی هستند.

در پست خود در Facebook مارک زاکربرگ، مدیر عامل متا، این کار را «پیشرفت شگفت‌انگیز» توصیف کرد و افزود: «ایجاد ویدیو بسیار دشوارتر از عکس‌ها است، زیرا علاوه بر تولید صحیح هر پیکسل، سیستم همچنین باید پیش‌بینی کند که چگونه آنها در طول زمان تغییر می‌کنند».

Make-A-Video: AI

این کلیپ‌ها بیش از پنج ثانیه طول نمی‌کشند و صدا ندارند، اما طیف وسیعی از سرنخ‌ها را پوشش می‌دهند. در حالی که واضح است که ویدئو تولید شده توسط کامپیوتر است، کیفیت چنین مدل های هوش مصنوعی در آینده نزدیک به سرعت بهبود خواهد یافت. تنها در چند سال، تولیدکننده‌های تصویر هوش مصنوعی از ایجاد تصاویر تقریباً نامفهوم به محتوای واقعی واقعی تبدیل شده‌اند. و در حالی که پیشرفت در ویدئو ممکن است با توجه به پیچیدگی تقریبا بی حد و حصر موضوع، کندتر باشد، جایزه تولید ویدیوی بدون درز باعث می شود بسیاری از سازمان ها و شرکت ها برای سرمایه گذاری منابع قابل توجه در پروژه انگیزه دهند.

این شرکت می‌گوید قصد دارد نسخه آزمایشی این سیستم را منتشر کند، اما زمان و نحوه اجرای آن را نگفته است. در مقاله‌ای که این مدل را توصیف می‌کند، محققان Meta خاطرنشان می‌کنند که Make-A-Video روی جفت‌های تصویر-کپشن و همچنین فیلم‌های ویدیویی بدون برچسب آموزش داده شده است.

محتوای آموزشی از دو مجموعه داده WebVid-10M و HD-VILA-100M مشتق شده است که در مجموع حاوی میلیون ها ویدیو و صدها هزار ساعت فیلم ویدئویی هستند. به هر حال، این شامل فیلم های استوک نیز می شود.

محققان خاطرنشان می‌کنند که این مدل علاوه بر فریم‌های تار و انیمیشن‌های پراکنده، محدودیت‌های فنی زیادی دارد. Make-A-Video 16 فریم ویدیو را با وضوح 64×64 پیکسل تولید می کند که سپس با استفاده از یک مدل هوش مصنوعی جداگانه به 768×768 پیکسل تغییر اندازه می دهد.

شما می توانید به اوکراین در مبارزه با مهاجمان روسی کمک کنید. بهترین راه برای انجام این کار، کمک مالی به نیروهای مسلح اوکراین است Savelife یا از طریق صفحه رسمی NBU.

همچنین جالب:

منبعواگرایی

ثبت نام

0 نظرات

بررسی های جاسازی شده

مشاهده همه نظرات

مقالات دیگر

متا هوش مصنوعی را برای ایجاد ویدیوها بر اساس توضیحات نشان داد

نظرات اخیر