Компанія OpenAI, відома своїми розробками ChatGPT та Sora, активно працює над створенням нового інструменту, що здатен генерувати музику на основі текстових та аудіопідказок. Як повідомляє видання The Information, цей крок знаменує повернення технологічного гіганта у сферу генеративного аудіо, що є частиною його стратегії домінування в усіх напрямках створення контенту.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Новий інструмент розробляється як мультимодальна система, яка зможе приймати як текстові описи (“створити бадьорий джазовий гітарний супровід”), так і наявні аудіодоріжки. Серед ключових сценаріїв використання, які розглядає OpenAI, є автоматичне додавання фонової музики до відео та створення інструментального супроводу до вже записаного вокалу. Аналітики прогнозують, що така функціональність матиме високу комерційну цінність, зокрема у сфері реклами та медіавиробництва.

Для забезпечення високої якості музичних виходів OpenAI пішла на безпрецедентний крок, налагодивши співпрацю зі студентами престижної Джульярдської школи. Ці студенти допомагають анотувати музичні партитури, надаючи високоякісні навчальні дані для моделі. Така співпраця підкреслює прагнення OpenAI поєднати мистецьку експертизу з машинним навчанням, а також потенційно допомагає у класифікації даних для запобігання майбутнім проблемам з авторськими правами.
Рекомендація редакції: ТОП-6 музичних генераторів зі штучним інтелектом, які вже доступні
Входження OpenAI у цей сегмент ринку загострює конкуренцію з іншими великими гравцями, такими як Google (з їхніми моделями MusicLM та Lyria) та успішними стартапами Suno і Udio. Це є частиною стратегії OpenAI з диверсифікації продукції та збільшення часу використання її сервісів, адже компанія прагне вийти за межі можливостей ChatGPT, який наразі може генерувати лише текст, як-от акорди чи тексти пісень.
Наразі точні терміни випуску інструменту залишаються невідомими, оскільки OpenAI зберігає конфіденційність щодо своїх неанонсованих продуктів. Також поки що не вирішено, чи стане цей музичний генератор самостійним продуктом, чи буде інтегрований у вже існуючі екосистеми ChatGPT та Sora. Однак, з огляду на стратегічний характер проєкту та залучення експертів з Джульярда, очікується, що новий інструмент може бути представлений протягом найближчого року-двох. Варто зазначити, що раніше OpenAI вже експериментувала з музичними моделями, випускаючи MuseNet (2019) та Jukebox (2020), але тоді вони не отримали широкої інтеграції.
Читайте також:
