Google випустила новий набір відкритих моделей машинного перекладу, створених на основі відкритої моделі Gemma 3. У компанії називають цю розробку “значним кроком вперед у відкритому перекладі”. Нова колекція отримала назву TranslateGemma та підтримує до 55 мов, серед яких і найпоширеніші: іспанська, французька, китайська, гінді та інші.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Анонс TranslateGemma з’явився майже одразу після того, як OpenAI оголосила про запуск спеціального інструменту ChatGPT Translate. Новий інструмент від OpenAI робить акцент не стільки на буквальному перекладі, скільки на збереженні тону, стилю й контексту. Він пропонує інтерфейс із двома вікнами: зліва – автоматичне визначення мови, справа – переклад цільовою мовою, що нагадує підхід Google Translate.

TranslateGemma доступна у трьох конфігураціях – з 4 млрд, 12 млрд і 27 млрд параметрів. За даними Google, модель з 12 млрд параметрів демонструє кращі результати, ніж базова Gemma 3 з 27 млрд параметрів, за підсумками тестування на бенчмарку WMT24++. Для розробників це означає суттєву перевагу: вища пропускна здатність і менша затримка без втрати точності, навіть за значно меншого розміру моделі.
Google зазначає, що версія з 4В параметрів оптимізована для виконання безпосередньо на мобільних пристроях, тоді як модель 12B добре підходить для споживчих ноутбуків. Натомість найбільша версія TranslateGemma на 27 млрд параметрів потребує значних обчислювальних ресурсів – наприклад, одного прискорювача NVIDIA H100 у хмарному середовищі. Під час тестів на бенчмарку Vistra для перекладу тексту на зображеннях TranslateGemma показала кращі результати, навіть попри те, що модель не проходила спеціалізованого донавчання для цього сценарію.

У Google також розповіли, як їм вдалося досягти такої “щільності інтелекту” в моделях. Для цього застосували спеціалізований двоетапний підхід. На першому етапі використовували метод Supervised Fine-Tuning, тобто базові моделі Gemma 3 навчали на поєднанні текстів, перекладених людьми, та високоякісних синтетичних даних, згенерованих моделями Gemini.
Другий етап передбачав використання навчання з підкріпленням. У цій фазі застосовували набір моделей винагороди, зокрема такі просунуті метрики, як MetricX-QE та AutoMQM. Вони допомагали спрямовувати модель у бік більш природних, контекстно точних і стилістично коректних перекладів.

Моделі TranslateGemma вже доступні для завантаження на платформах Kaggle та Hugging Face. Їх можуть використовувати всі охочі, як для експериментів, так і для створення власних продуктів або подальшого доопрацювання моделей.
Читайте також:
- Приватна версія Габбла: Ексглава Google фінансує космічний телескоп нового покоління
- Apple і Google уклали угоду: нова Siri працюватиме на базі Gemini
