Компанія Apple представила нові невеликі мовні моделі під назвою OpenELM. Це вважається важливим кроком у розвитку генеративних моделей штучного інтелекту. Це також підтверджує намір Apple запропонувати функції штучного інтелекту в пристроях на додаток до хмарних сервісів ШІ.
Поки Apple готується оголосити про функції штучного інтелекту, які з’являться в iPhone у червні, вона стрімко просувається вперед у цій галузі. В останні місяці дослідники Apple представили різні моделі штучного інтелекту і зробили новий крок у цьому напрямку.
Дослідники опублікували свої мовні моделі, які вони називають “OpenELM”, на платформі Hugging Face Hub. Ці моделі розглядаються як важливий крок у використанні продуктивного штучного інтелекту в пристроях.
Ці моделі, що отримали назву “Open Source Efficient Language Models” (OpenELM), характеризуються як “високоефективні” під час розв’язання текстових завдань, особливо в таких галузях, як написання електронних листів. Крім того, ці моделі мають відкритий вихідний код і можуть бути використані будь-яким розробником.
Моделі OpenELM доступні в чотирьох різних розмірах і можуть бути описані як “невеликі мовні моделі”. Розмір цих моделей становить 270 млн параметрів, 450 млн параметрів, 1,1 млрд параметрів і 3 млрд параметрів. Параметри вказують на те, скільки змінних моделі можуть вивчити на основі навчальних наборів даних.
Для прикладу, щоб зрозуміти, наскільки малий розмір моделі, Microsoft днями анонсувала свою нову модель штучного інтелекту Phi-3 і назвала її “нашою найменшою моделлю штучного інтелекту”. Розмір цієї моделі становить лише 3,8 млрд параметрів. Для порівняння, моделі Apple можуть мати до 270 млн параметрів. Менші розміри означають, що вони коштують дешевше і можуть бути оптимізовані для більш ефективної роботи на таких пристроях, як мобільні телефони та ноутбуки.
Читайте також: