Стартап Ілона Маска xAI, що займається розробкою штучного інтелекту, анонсував свою останню генеративну модель ШІ – Grok-1.5. Ця версія у недалекому майбутньому (“найближчими днями”, як повідомляють у блозі) стане доступна у Twitter. Зазначається, що вона є помітним покращенням порівняно зі своїм попередником, принаймні судячи з опублікованих результатів тестів і специфікацій.
Серед переваг моделі Grok-1.5 можна виділити “поліпшення у плані аргументації”, як говорять у компанії, особливо там, де це стосується кодування і завдань, пов’язаних з математикою. Модель покращила результат Grok-1 у популярному математичному тесті MATH більш ніж вдвічі, а також набрала на 10% більше балів у тесті HumanEval, який перевіряє здібності до генерації мов програмування та розв’язання проблем.
Важко передбачити, як ці результати позначаться на реальному використанні. Адже насправді загальноприйняті бенчмарки штучного інтелекту, які вимірюють такі речі, як відповіді на питання НМТ з хімії, не надто добре відображають те, як середньостатистична людина сьогодні взаємодіє з моделями ШІ.
— xAI (@xai) March 29, 2024
Одне з покращень, яке має призвести до помітних успіхів, – це обсяг контексту, який Grok-1.5 може зрозуміти порівняно зі своїм попередником. Повідомляється, що нова модель зможе обробляти контексти до 128 тис. токенів. Моделі з маленькими контекстними вікнами мають тенденцію забувати зміст навіть недавніх розмов, тоді як моделі з більшими контекстами уникають цієї пастки та краще розуміють набір даних, які приймають. “[Grok-1.5 може] використовувати інформацію зі значно довших документів, – говорять у xAI. – Крім того, модель може обробляти довші та складніші підказки, зберігаючи при цьому здатність слідувати інструкціям, оскільки її контекстне вікно розширюється”.
Історично моделі Grok від xAI відрізняються від інших генеративних моделей ШІ тим, що відповідають на запитання на теми, які зазвичай є забороненими для інших моделей, наприклад, про змови та суперечливі політичні ідеї. Моделі також відповідають на запитання з “бунтарським присмаком”, як описав їх Ілон Маск, і на відверто грубі висловлювання, якщо їх про це попросять.
Grok-1.5 незабаром буде доступний раннім тестувальникам у Twitter разом з “кількома новими функціями”. Раніше Ілон Маск натякав на можливість підсумовувати теми та відповіді, а також пропонувати контент для постів.
Нагадаю, нещодавно ми писали, що xAI випустив Grok-1 з відкритим вихідним кодом, хоча і без коду, необхідного для його доопрацювання або подальшого навчання. Ілон Маск також додав, що більше користувачів Twitter – зокрема, ті, хто платить за преміумпідписку $8 на місяць, – отримають доступ до чат-бота Grok, який раніше був доступний лише для клієнтів Premium+ (які платять $16 на місяць).
Читайте також: