Microsoft представила передову ШІ-модель Phi-2, що налічує 2,7 млрд параметрів. Модель продемонструвала чудові результати в широкому спектрі тестів, включно з розумінням мови, розв’язанням математичних задач, програмуванням і обробкою інформації. Головною особливістю Phi-2 є її здатність конкурувати, а часто і перевершувати ШІ-моделі, які в 25 разів перевищують її за розміром. Новинка вже доступна через Microsoft Azure AI Studio для дослідників і розробників, які бажають інтегрувати передовий ШІ у свої застосунки.
Генеральний директор Microsoft Сатья Наделла представив модель Phi-2 на заході Ignite. Відмінною особливістю цієї моделі є її навчання на даних, що відповідають якості навчального рівня. Це означає, що дані для навчання моделі були ретельно відібрані та структуровані, що сприяло точності та ефективності навчання. Такий підхід дає змогу Phi-2 ефективніше переносити знання і тлумачення, отримані з інших моделей, зміцнюючи її здібності в галузях розуміння мови, логічного мислення та обробки інформації.
Phi-2 змінює усталені уявлення про зв’язок між розміром і потужністю мовних моделей. Модель можна порівняти з великими ШІ-моделями, такими як 7B Mistral компанії Mistral AI, 13B Llama 2 компанії Meta і навіть 70B Llama-2. На особливу увагу заслуговує здатність Phi-2 перевершувати навіть Gemini Nano компанії Google, найефективнішу модель у серії Gemini, призначену для роботи на мобільних пристроях. Це підкреслює потенціал Phi-2 у сфері мобільних технологій, надаючи функції автоматичного резюмування текстів, просунутої коректури та виправлення граматики, а також контекстуальних інтелектуальних відповідей.
Фахівці Microsoft підкреслюють, що висока продуктивність моделі Phi-2 досягнута без застосування методів навчання з підкріпленням (reinforcement learning), заснованих на людському зворотному зв’язку, або методів інструкційного налаштування (instructional tuning). Це дає змогу моделі ефективно мінімізувати прояви упередженості та знижувати ризик токсичних вихідних даних, що робить Phi-2 однією з найбезпечніших і найетичніших моделей у сфері ШІ.
Phi-2 є частиною серії малих мовних моделей (SLMs) компанії Microsoft. Перша модель цієї серії, Phi-1 з 1,3 млрд параметрів, вийшла раніше цього року і була націлена на завдання програмування мовою Python. У вересні було представлено Phi-1.5 з аналогічною кількістю параметрів, але навчена на нових даних, включно із синтетичними текстами, створеними за допомогою програмування природною мовою.
Phi-2 відкриває нову главу в машинному навчанні, де якість і ефективність навчання стають ключовими факторами. Ця ШІ-модель не тільки свідчить про значні досягнення Microsoft у цій сфері, а й надає нові можливості для розробників і дослідників у всьому світі, відкриваючи двері до розумніших і безпечніших технологій майбутнього.
Читайте також: