Google розгортає нові функції Gemini – відео в реальному часі (Live Video) та спільне використання екрана (Screen-Sharing). Ці функції будуть доступні для передплатників Gemini Advanced і вперше були представлені на Google I/O 2024. Про функції Gemini Live і Screen-Sharing також говорили на MWC 2025.
Щоб дізнатись останні новини, слідкуйте за нашим каналом Google News онлайн або через застосунок.
Функції відео в реальному часі та спільний доступ до екрана розроблені Google DeepMind в рамках проєкту Astra, ці функції оснащені можливостями обробки мультимодальних даних в реальному часі і дозволяють чат-боту зі штучним інтелектом (AI) відповідати на запити про пристрій користувача та його оточення в режимі реального часу. Раніше компанія заявляла, що ці нові функції будуть запущені до березня. Ще раз зазначу, що наразі ці функції доступні лише для передплатників тарифного плану Gemini Advanced у мобільних застосунках.
Користувач Reddit Kien_PS, якого вперше помітив 9to5Google, нещодавно опублікував скріншот на субредіті Bard (стара назва Gemini), демонструючи функцію «Ділитися екраном у прямому ефірі». Той самий користувач у неділю знову опублікував демонстраційне відео з цією функцією, в якому показав, як вона працює.
Окремо представник Google Алекс Джозеф повідомив виданню The Verge, що нові функції штучного інтелекту з’являються в Gemini Live. Окрім спільного використання екрана, Gemini також зможе отримати доступ до камери пристрою користувача і відповідати на запити про те, що користувач бачить в режимі реального часу.
Ця можливість обробки даних у реальному часі тепер дозволить користувачам задавати Gemini запити про те, як одягнутися, показуючи йому свій гардероб, або ідентифікувати пам’ятник чи магазин, коли вони знаходяться на вулиці. Функція спільного використання екрана, яка є вдосконаленою версією існуючої функції Talk about the screen, дозволить Gemini допомагати користувачеві під час навігації між різними екранами на смартфоні.
Обидві ці функції є частиною Gemini Live, яка була запущена для користувачів минулого року, і може вести двосторонню голосову розмову з користувачами в реальному часі. Раніше Google заявляла, що хоче зробити Gemini кориснішим у ситуаціях, що виникають у режимі реального часу.
Примітно, що функція відео Gemini Live схожа на розширений голосовий режим з функцією зору OpenAI для ChatGPT і функцію відео в реальному часі в окулярах Ray-Ban Meta. З розвитком штучного інтелекту та базової інфраструктури, що лежить в основі технології, а хмарні сервери стають потужнішими, технологічні гіганти можуть запропонувати швидший висновок для випадків використання в реальному часі.

Компанія не поділилася жодною інформацією про те, коли і чи буде ця функція розширена до безкоштовного рівня. Підписку Gemini Advanced можна придбати в рамках плану Google One AI Premium.
Читайте також:
- Google представила нові можливості Gemini для спільної роботи та творчості
- Google надає українцям безкоштовний доступ до курсу AI Essentials