Німецька компанія DeepL представила у своєму онлайн-перекладачі нову функцію DeepL Voice, орієнтовану на використання в живих бесідах і відеоконференціях. Тепер користувачі можуть перекладати усне мовлення з однієї мови на іншу і конвертувати в текст у режимі реального часу. Цей крок став черговою відповіддю на зростаючий інтерес до сервісів на основі штучного інтелекту.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Система машинного перекладу DeepL Voice, що виконує, на думку самої компанії, переклади «безпрецедентно високої якості», Поки що сервіс підтримує 13 мов, зокрема англійську, німецьку, японську, корейську, іспанську та інші. Української наразі немає. При цьому текстові переклади доступні для 33 мов, підтримуваних платформою.
Новий продукт DeepL може працювати як у форматі «дзеркал», коли переклади відображаються на екрані телефону, щоб учасники зустрічі могли бачити перекладений текст, так і у вигляді субтитрів для відеоконференцій. Поки що DeepL Voice підтримує інтеграцію тільки з Microsoft Teams, що, за словами засновника компанії Ярека Кутиловського, насправді покриває більшу частину їхньої клієнтської бази. Про підтримку інших сервісів, таких як Zoom або Google Meet, інформації поки що немає.
Кутиловський зазначив, що DeepL Voice є першим кроком компанії в галузі голосових технологій, і планується подальший розвиток продукту. Він наголосив, що голосовий переклад посів один із ключових напрямків, який активно розвиватиметься найближчими роками, водночас DeepL і надалі покращуватиме якість своїх перекладів, розробляючи власні ШІ-моделі, завдяки яким можна досягти вищої точності, особливо в режимі реального часу.
Глава компанії також розповів про можливі сценарії використання нової функції. Наприклад, у сфері обслуговування, де співробітники ресторанів, кафе і готелів зможуть спілкуватися з клієнтами, які розмовляють різними мовами. Що ж стосується конфіденційності даних, адже обробка голосів користувачів відбувається на серверах компанії, Кутиловський запевнив, що DeepL не зберігає і не використовує аудіозаписи для навчання своїх моделей, а також дотримується всіх вимог GDPR та інших нормативних актів.
Варто зазначити, що DeepL не єдина компанія, яка працює над подібними рішеннями. Google та інші стартапи, такі як Eleven Labs і Panjaya, також розробляють сервіси голосового перекладу з конвертацією аудіо в текст.
Якщо вам цікаві статті та новини про авіацію та космічну техніку — запрошуємо вас на наш новий проєкт AERONAUT.media.
Читайте також: