Root NationНовиниНовини ITУкраїнську LLM натренують на моделі Gemma 3 від Google

Українську LLM натренують на моделі Gemma 3 від Google

Google Gemma 3

Українську національну велику мовну модель планують створити на основі Gemma 3 від Google – саме цю open-source архітектуру Мінцифри та Київстар визначили оптимальною для подальшого розвитку. У відомстві пояснюють, що планують попередньо навчити модель на унікальних українських даних, а під час вибору бази орієнтувалися на якість роботи з українською мовою та можливість повністю контролювати перебіг навчання. Такий підхід дасть змогу мінімізувати мовні та етичні ризики й створити LLM, яка буде коректно, стабільно та безпечно працювати у державних і комерційних застосуваннях.

Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.

Вибрану модель адаптують до української мови. Зокрема, планується покращення українського токенайзера, що підвищить точність генерації текстів, зменшить кількість помилок і водночас оптимізує обчислювальні витрати. Паралельно команда займається збором і підготовкою набору україномовних текстів, на якому Gemma буде донавчена. Також створять спеціальні бенчмарки та тести, щоб точніше налаштовувати модель перед запуском у реальні сценарії використання.

Google Gemma 3

“Вибір Gemma забезпечує оптимальний баланс між продуктивністю та ресурсами, а також високу якість навчання української LLM, – говорить директор з розробки диджитал-продуктів Київстар Михайло Нестор. – Модель підтримує понад 140 мов, включно з українською, має до 128 тисяч токенів, мультимодальні можливості та гнучку архітектуру, що дозволяє адаптувати її під різні завдання”.

Відзначається, що Gemma забезпечує високу якість при оптимальних інфраструктурних вимогах. Експерти назвали її однією з найкращих відкритих моделей з погляду співвідношення розміру та якості. Вона легко адаптується через донавчання, а також може сприймати й аналізувати не тільки текст, але й зображення. Модель вже продемонструвала відмінні результати під час створення MamayLM та Lapa LLM, одних з найуспішніших україномовних моделей, а також стала основою для INSAIT BgGPT, сучасної LLM для болгарської мови.

Google

У Google підкреслюють, що вибір Gemma для української LLM – значуще рішення, яке підтверджує її стратегічну цінність. “Для нас велика честь, що Міністерство цифрової трансформації та Київстар обрали Gemma як основу для національної української великої мовної моделі (LLM), – зазначив керівник з Customer Engineering Google Cloud у регіоні Центральної та Східної Європи Кшиштоф Казьов. – Це рішення підкреслює стратегічну цінність Gemma, яка забезпечує оптимальний баланс між продуктивністю та ресурсами, а також сильну багатомовну підтримку. Спираючись на успіх Gemma як бази для провідних українських LLM-моделей, ми налаштовані й надалі підтримувати цю ключову ініціативу, спрямовану на розвиток цифрового досвіду в Україні”.

Читайте також:

Джерелоthedigital
Підписатися
Сповістити про
guest

0 Comments
Найновіше
НайстарішіНайбільше голосів
Соцмережі та підписка