На своєму заході Spring Update компанія OpenAI представила ШІ-модель GPT-4 Omni (або скорочено GPT-4o), яка може похизуватися розмовними можливостями, подібними до людських. “Omni” вказує на мультимодальні можливості моделі, тож GPT-4o не тільки робить цю версію ChatGPT швидшою (і при цьому все ще безкоштовною для більшої кількості людей), але й розширює способи взаємодії з нею завдяки підтримці розмови через мобільний або десктопний застосунок.
“Особливість GPT-4o полягає в тому, що він є інтелектом рівня GPT-4 для всіх, включаючи наших безкоштовних користувачів, – сказала технічна директорка OpenAI Міра Мураті під час презентації.
Dog meets GPT-4o pic.twitter.com/5C0hlYq5ws
— OpenAI (@OpenAI) May 13, 2024
Повідомляється, що GPT-4o робить значний крок у розумінні людського спілкування, і з чат-ботом можна буде спілкуватися у природній манері чи пожартувати. Під час демонстрації в прямому етері ведучий важко дихав у телефон і попросив прокоментувати техніку дихання. На що ChatGPT відповів “Ви не пилосос” і порадив дихати повільніше. Так, ChatGPT має почуття гумору, але також змінює тон відповідей, доповнюючи їх різними інтонаціями. Його можна перебити, поправити, попросити говорити в певному тоні чи стилі.
Live demo of GPT-4o realtime conversational speech pic.twitter.com/FON78LxAPL
— OpenAI (@OpenAI) May 13, 2024
Щобільше, він зможе одразу робити переклад. Під час демонстрації двоє доповідачів на сцені, один з яких говорив англійською, а інший – італійською, розмовляли з Chat GPT-4o, який займався перекладом. Він міг швидко виконати переклад з італійської на англійську, а потім безперешкодно перекласти англійську відповідь назад на італійську.
GPT-4o розуміє не лише голос, але й візуальні образи, наприклад, записане лінійне рівняння, а потім підкаже, як його розв’язати, а також перегляне селфі в реальному часі та надасть опис. Звісно, не обійшлося і без галюцинацій. У якийсь момент ChatGPT заявив, що бачить зображення дерев’яної стільниці, яку йому надсилали раніше, замість селфі з обличчям. Але він швидко виправився.
OpenAI в черговий раз дала змогу відчути смак корисних можливостей ШІ. Якщо партнерство з Apple, про яке ходять чутки, стане реальністю, Siri отримає додаткові можливості, а Google майже напевно продемонструє свої новітні трюки зі штучним інтелектом на конференції I/O.
OpenAI зробить нову модель доступною для всіх, включаючи безкоштовних користувачів ChatGPT, протягом наступних кількох тижнів, а також випустить десктопну версію ChatGPT. Спочатку вона буде доступна на Mac, і платні користувачі вже мають отримати до неї доступ.
Читайте також: