Root NationНовиниНовини ITШІ від Meta, який дозволяє розмовляти шістьма мовами

ШІ від Meta, який дозволяє розмовляти шістьма мовами

-

Хоча Microsoft і Google, як правило, домінують у заголовках новин, пов’язаних зі штучним інтелектом, багато інших компаній також поспішають розробляти продукти зі штучним інтелектом, зокрема й Meta. З цією метою гігант соціальних мереж щойно представив свою першу розробку в цій галузі.

ШІ від Meta, який дозволяє розмовляти шістьма мовами

Сьогодні у своєму блозі Meta повідомила, що працює над створенням інструменту штучного інтелекту для розпізнавання мови. Фірма заявляє, що її інструмент під назвою Voicebox може виконувати різноманітні завдання з генерації мовлення, “яким він не був спеціально навчений за допомогою контекстного навчання”.

За словами Мета, деякі з цих завдань включають синтез тексту в мовлення в контексті, редагування мовлення, зменшення шуму, передачу міжмовного стилю та вибірку різноманітних зразків мовлення. Ось як компанія описує ці функції:

  • Контекстне перетворення тексту в мовлення: Використовує аудіо-зразки тривалістю до двох секунд, щоб відповідати стилю аудіо та використанню для перетворення тексту в мовлення.
  • Редагування мовлення та зменшення шуму: Інструмент може відтворити фрагмент мови, який було перервано шумом, або замінити неправильно вимовлені слова без необхідності перезапису.
  • Передача стилю між мовами: Інструмент може взяти зразок мовлення та уривок тексту, щоб відтворити його англійською, французькою, німецькою, іспанською, польською, португальською або французькою мовами.
  • Різноманітна вибірка мовлення: Використовує різноманітні дані для створення мовлення, яке більш репрезентативно відображає те, як люди розмовляють шістьма мовами, згаданими вище.

Meta

Організація заявляє, що Voicebox є частиною її досліджень у галузі генеративного ШІ. Щодо його корисності, Meta заявляє:

У майбутньому багатоцільові моделі генеративного ШІ, такі як Voicebox, можуть надати природне звучання голосам віртуальних помічників і неігрових персонажів у метасвіті. Вони можуть дозволити людям з вадами зору чути письмові повідомлення від друзів, начитані ШІ їхніми голосами, надати творцям нові інструменти для легкого створення та редагування звукових доріжок для відео та багато іншого.

Якщо ви хочете побачити приклад Voicebox, ви можете перейти до блогу Meta і подивитися відео, розміщене там.

Читайте також:

ДжерелоAndroidauthority
Підписатися
Сповістити про
guest

0 Comments
Найновіше
Найстаріші Найбільше голосів
Inline Feedbacks
View all comments
Підписатися на оновлення