مولدهای تبدیل متن به تصویر هوش مصنوعی (AI) در ماههای اخیر خبرساز شدهاند، اما محققان در حال حاضر به سراغ مرز بعدی رفتهاند: تولیدکنندههای متن به تصویر با هوش مصنوعی. The Verge گزارش می دهد که محققان متا به طور عمومی چنین ژنراتور جدیدی را ارائه کرده اند.
تیم مهندسی یادگیری ماشین متا ارایه شده یک سیستم جدید به نام Make-A-Video. این مدل هوش مصنوعی به کاربران این امکان را می دهد تا توصیفی تقریبی از صحنه را وارد کنند و ویدیوی کوتاهی تولید می کند که با متن آنها مطابقت دارد. ویدیوها به وضوح مصنوعی، با اشیاء تار و انیمیشن های تحریف شده هستند، اما همچنان یک دستاورد قابل توجه در زمینه تولید محتوای هوش مصنوعی هستند.
در پست خود در Facebook مارک زاکربرگ، مدیر عامل متا، این کار را «پیشرفت شگفتانگیز» توصیف کرد و افزود: «ایجاد ویدیو بسیار دشوارتر از عکسها است، زیرا علاوه بر تولید صحیح هر پیکسل، سیستم همچنین باید پیشبینی کند که چگونه آنها در طول زمان تغییر میکنند».
این کلیپها بیش از پنج ثانیه طول نمیکشند و صدا ندارند، اما طیف وسیعی از سرنخها را پوشش میدهند. در حالی که واضح است که ویدئو تولید شده توسط کامپیوتر است، کیفیت چنین مدل های هوش مصنوعی در آینده نزدیک به سرعت بهبود خواهد یافت. تنها در چند سال، تولیدکنندههای تصویر هوش مصنوعی از ایجاد تصاویر تقریباً نامفهوم به محتوای واقعی واقعی تبدیل شدهاند. و در حالی که پیشرفت در ویدئو ممکن است با توجه به پیچیدگی تقریبا بی حد و حصر موضوع، کندتر باشد، جایزه تولید ویدیوی بدون درز باعث می شود بسیاری از سازمان ها و شرکت ها برای سرمایه گذاری منابع قابل توجه در پروژه انگیزه دهند.
این شرکت میگوید قصد دارد نسخه آزمایشی این سیستم را منتشر کند، اما زمان و نحوه اجرای آن را نگفته است. در مقالهای که این مدل را توصیف میکند، محققان Meta خاطرنشان میکنند که Make-A-Video روی جفتهای تصویر-کپشن و همچنین فیلمهای ویدیویی بدون برچسب آموزش داده شده است.
محتوای آموزشی از دو مجموعه داده WebVid-10M و HD-VILA-100M مشتق شده است که در مجموع حاوی میلیون ها ویدیو و صدها هزار ساعت فیلم ویدئویی هستند. به هر حال، این شامل فیلم های استوک نیز می شود.
محققان خاطرنشان میکنند که این مدل علاوه بر فریمهای تار و انیمیشنهای پراکنده، محدودیتهای فنی زیادی دارد. Make-A-Video 16 فریم ویدیو را با وضوح 64×64 پیکسل تولید می کند که سپس با استفاده از یک مدل هوش مصنوعی جداگانه به 768×768 پیکسل تغییر اندازه می دهد.
شما می توانید به اوکراین در مبارزه با مهاجمان روسی کمک کنید. بهترین راه برای انجام این کار، کمک مالی به نیروهای مسلح اوکراین است Savelife یا از طریق صفحه رسمی NBU.
همچنین جالب:
- هوش مصنوعی به یافتن ناهنجاری های کیهانی جدید کمک می کند
- رئیس سابق گوگل هوش مصنوعی را با سلاح های هسته ای مقایسه کرد