Meta представляє ще одну модель штучного інтелекту для дослідників і компаній, які цікавляться перекладом мов і пов’язаними з ним застосунками. Техногігант розробив першу модель “все в одному”, яка може виконувати широкий спектр завдань на 100 мовах.
Нова модель ШІ від Meta має потенціал стати основою для надійних та ефективних послуг “універсального перекладу”. Вона має назву SeamlessM4T і є першою універсальною багатомовною, “мультимодальною” моделлю перекладу та транскрипції зі ШІ. Представники компанії Meta стверджують, що модель пропонує підтримку до 100 різних мов, залежно від конкретного завдання.
SeamlessM4T є базовою багатомовною та багатозадачною моделлю, здатною перекладати та транскрибувати як розмову, так і текст, створювати переклади в різних форматах, включаючи варіанти “голос в голос”, “голос в текст”, “текст в голос” і “текст в текст”. Цікаво, що нова модель ШІ може виконувати автоматичне розпізнавання мови без використання базових зразків.
Мовна підтримка залежить від завдання: переклади типу “голос в голос” і “текст в голос” підтримуються 35 мовами (плюс англійська), а для всіх інших режимів доступно близько 100 мов. Компанія Meta випустила код SeamlessM4T під ліцензією Creative Commons (CC BY-NC 4.0), що свідчить про її намір надати дослідникам і розробникам можливість використовувати свою роботу для створення нових застосунків та рішень.
ШІ SeamlessM4T, вочевидь, натхненний вигаданою рибкою-транслятором з “Путівника по Галактиці для космотуристів” Дуґласа Адамса, має на меті перетворити концепцію “універсального перекладача” з вигадки на реальність. Мультимодальний підхід, який використовує модель, має потенціал мінімізувати помилки та затримки, тим самим підвищуючи ефективність та якість перекладу для людей, які розмовляють різними мовами. Ця технологія може сприяти більшій доступності та взаєморозумінню між людьми з різним мовним досвідом.
В SeamlessM4T Meta посилається на власну модель машинного перекладу з тексту в текст NLLB (No Language Left Behind), яка підтримує 200 мов і була інтегрована у Вікіпедію. Крім того, компанія відзначає свою нещодавню демонстрацію Universal Speech Translator, яка ознаменувала впровадження першої системи прямого перекладу “голос в голос” для мови хоккієн (різновид китайської мови).
Крім того, нещодавно представлена модель Massively Multilingual Speech від Meta охоплює можливості розпізнавання мовлення, ідентифікації мови та синтезу мовлення на більш ніж 1100 мовах. В блозі Meta AI можна більше дізнатися про модель SeamlessM4T, її перекладацькі можливості та відповідальний підхід до таких делікатних тем, як токсичність і гендерні упередження, а код SeamlessM4T доступний на GitHub.
Читайте також: