Сьогодні вже має початися конференції для розробників Google I/O (початок заплановано на 19:00 за київським часом), а техногігант вирішив трохи подражнити авдиторію і представив нову інтригуючу функцію штучного інтелекту, для роботи якої потрібна камера.
Компанія опублікувала на своїй сторінці у Twitter коротке відео, в якому, схоже, демонструється нова функція ШІ, яка працює через камеру і здатна розпізнавати об’єкти в кадрі в режимі реального часу.
На відео показано пристрій Pixel з увімкненою камерою, яка направлена на сцену, де триває підготовка до основної доповіді на конференції. Людина, яка тримає камеру, запитує: “Агов, як ви думаєте, що тут відбувається?”.
На це ШІ відповідає, що “схоже на те, що люди готуються до великої події, можливо, конференції чи презентації”. Він також зміг ідентифікувати літери “IO” як такі, що пов’язані з конференцією розробників Google і згадує про “нові досягнення в галузі штучного інтелекту”. Також на екрані можна побачити текстову транскрипцію діалогу.
https://twitter.com/Google/status/1790055114272612771
Не зовсім зрозуміло, що це за функція, хоча вона має певну схожість з пошуком Google Lens, що працює за допомогою камери. Однак те, що показано в тизерному відео, схоже, працює в режимі реального часу і швидко реагує на голосові команди. Той факт, що демонстрація показана на пристрої Pixel, також цікавий. оскільки Google часто робить нові функції зі ШІ доступними, в першу чергу, на пристроях лінійки Pixel.
Хоча для Google дещо незвично демонструвати один зі своїх анонсів так скоро перед великим виступом, ймовірно, це може бути відповіддю компанії на новинку від OpenAI. Нагадаю, ми сьогодні писали, що OpenAI провела захід Spring Update у прямому етері, на якому продемонструвала схожі можливості своєї нової моделі GPT-4o. Її мультимодальні можливості дозволятимуть отримати дані не лише з тексту в діалозі, але й через голосові запити або зображення з камери. Так, чат-бот зміг розпізнати емоції на обличчі людини (хоча за секунду до цього сплутав його з дерев’яною стільницею, зображення якої було завантажено до діалогу раніше).
Також цей анонс говорить про те, що штучний інтелект, його можливості та реалізація нових функцій буде в центрі уваги на цьогорічній конференції. Імовірно, ми більше дізнаємося про модель Gemma, яка, як планується, буде версією Gemini з відкритим вихідним кодом. Крім того, тут очікується дебют Pixel 8a та Android 15.
https://twitter.com/Google/status/1787955103342751994
Читайте також: