Компанія Meta представила нову серію моделей штучного інтелекту Llama 4, що складається з трьох нових моделей: Llama 4 Scout, Llama 4 Maverick та Llama 4 Behemoth. Вони забезпечують можливість мультимодальної взаємодії, тобто здатні відповідати не тільки на текстові запити, а й обробляти зображення, відео тощо. Моделі навчалися на «великій кількості немаркованих текстових, графічних і відеоданих» для забезпечення «широкого візуального розуміння».
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Цей випуск став відповіддю на успіхи китайської компанії DeepSeek, чия модель R1 перевершила попередні моделі Meta.
Моделі Scout і Maverick вже доступні для розробників на платформі Llama та через партнерів Meta, таких як Hugging Face. Behemoth, найбільша з нових моделей, ще знаходиться на стадії навчання.
Однією з ключових особливостей моделей Llama 4 є їх MoE-архітектура, що дозволяє знижувати витрати на обробку, активуючи лише необхідні для конкретного завдання моделі. Наприклад, Maverick має 400 мільярдів параметрів, з яких активні лише 17 мільярдів. Архітектури MoE здебільшого розбивають завдання обробки даних на підзадачі, а потім делегують їх дрібнішим спеціалізованим «експертним» моделям.
Meta зазначає, що Llama 4 забезпечує новий рівень в обробці запитів, а також покращує точність відповідей на спірні питання. Це відбувається на фоні критики існуючих AI-моделей за політичну упередженість, яку компанія намагається зменшити.
Усі моделі Llama 4 здатні працювати з текстом, зображеннями та відео, а Scout має максимальну довжину контексту в 10 мільйонів токенів, що дозволяє обробляти великі документи. Maverick і Scout доступні для самостійного хостингу, тоді як Behemoth, що має 288 мільярдів активних параметрів, ще перебуває в розробці.
Згідно з внутрішнім тестуванням Meta, Maverick перевершує деякі з найвідоміших моделей, таких як GPT-4o, в певних завданнях, хоча й поступається новішим моделям, як-от Gemini 2.5 Pro. Meta також підкреслює, що нові моделі розроблені для підвищення ефективності та зниження витрат на навчання.
Ці нові моделі обіцяють стати конкурентами для інших провідних моделей штучного інтелекту, пропонуючи відкриті рішення для дослідників та компаній.
Читайте також:
- AI від Google самостійно опанував Minecraft за лічені дні
- OpenAI презентує нову мовну модель у найближчі місяці