Meta випустила нову серію флагманських AI-моделей Llama 4

Компанія Meta представила нову серію моделей штучного інтелекту Llama 4, що складається з трьох нових моделей: Llama 4 Scout, Llama 4 Maverick та Llama 4 Behemoth. Вони забезпечують можливість мультимодальної взаємодії, тобто здатні відповідати не тільки на текстові запити, а й обробляти зображення, відео тощо. Моделі навчалися на «великій кількості немаркованих текстових, графічних і відеоданих» для забезпечення «широкого візуального розуміння».

Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.

Цей випуск став відповіддю на успіхи китайської компанії DeepSeek, чия модель R1 перевершила попередні моделі Meta.

Meta Llama 4

Моделі Scout і Maverick вже доступні для розробників на платформі Llama та через партнерів Meta, таких як Hugging Face. Behemoth, найбільша з нових моделей, ще знаходиться на стадії навчання.

Однією з ключових особливостей моделей Llama 4 є їх MoE-архітектура, що дозволяє знижувати витрати на обробку, активуючи лише необхідні для конкретного завдання моделі. Наприклад, Maverick має 400 мільярдів параметрів, з яких активні лише 17 мільярдів. Архітектури MoE здебільшого розбивають завдання обробки даних на підзадачі, а потім делегують їх дрібнішим спеціалізованим «експертним» моделям.

Meta Llama 4

Meta зазначає, що Llama 4 забезпечує новий рівень в обробці запитів, а також покращує точність відповідей на спірні питання. Це відбувається на фоні критики існуючих AI-моделей за політичну упередженість, яку компанія намагається зменшити.

Усі моделі Llama 4 здатні працювати з текстом, зображеннями та відео, а Scout має максимальну довжину контексту в 10 мільйонів токенів, що дозволяє обробляти великі документи. Maverick і Scout доступні для самостійного хостингу, тоді як Behemoth, що має 288 мільярдів активних параметрів, ще перебуває в розробці.

Meta Llama 4

Згідно з внутрішнім тестуванням Meta, Maverick перевершує деякі з найвідоміших моделей, таких як GPT-4o, в певних завданнях, хоча й поступається новішим моделям, як-от Gemini 2.5 Pro. Meta також підкреслює, що нові моделі розроблені для підвищення ефективності та зниження витрат на навчання.

Ці нові моделі обіцяють стати конкурентами для інших провідних моделей штучного інтелекту, пропонуючи відкриті рішення для дослідників та компаній.

Читайте також:

Джерелоtechcrunch

Підписатися

0 Comments

Найновіше

Найстаріші Найбільше голосів

Зворотній зв'язок в режимі реального часу

Переглянути всі коментарі

Інші статті

Meta випустила нову серію флагманських AI-моделей Llama 4

Останні коментарі