Сталося так, як і гадалося – конференція Google I/O 2024 була повністю присвячена Gemini та штучному інтелекту. Настільки, що слово “ШІ” прозвучало тут 121 раз у самих різних контекстах.
Представники техногіганта розповідали про перспективи та можливості використання штучного інтелекту у різних сферах – від ШІ-асистента Project Astra до впровадження Gemini майже в кожну послугу, застосунок чи продукт, які пропонує компанія і якими користуються понад 2 млрд людей по всьому світу.
Перш за все, Google анонсувала нову оптимізовану модель ШІ під назвою Gemini 1.5 Flash, яка знаходитиметься між Gemini 1.5 Pro і Gemini 1.5 Nano, яка є найменшою моделлю компанії, що працює локально на пристрої. Техногігант створив цю версію, щоб запропонувати розробникам легшу і дешевшу модель, ніж Gemini Pro, для створення застосунків і сервісів на основі ШІ, але зберегти в ній деякі особливості, такі як довге контекстне вікно з мільйоном токенів, що відрізняє Gemini Pro від конкуруючих моделей.
Пізніше цього року Google планує подвоїти контекстне вікно Gemini до 2 млн токенів, а це означає, що він зможе одночасно обробляти дві години відео, 22 години аудіо, понад 60 000 рядків коду або понад 1,4 млн слів.
Штучний інтелект обіцяє вивести Google Фото на новий рівень. Оновлення, яке об’єднає Google Фото з Gemini, не просто надасть йому доступ до галереї, але й запропонує функцію пошуку, завдяки якій можна буде легко шукати якісь зображення з минулого. Так, після додавання оновлення на базі ШІ передплатники Google One у США зможуть поставити застосунку складні запитання на кшталт “покажи мені найкращу фотографію з кожного національного парку, який я відвідав”.
Очікується, що нова функція буде запущена протягом кількох наступних місяців. Застосунок використовуватиме GPS, а також власне судження про те, що є “найкращим”, щоб запропонувати різні варіанти. Також можна буде попросити застосунок створити підпис для публікації фотографій у соцмережах.
Google внесе значні зміни в принцип роботи Пошуку. Більшість представлених оновлень, таких як можливість задавати дійсно складні питання або використання Пошуку для планування меню чи відпустки будуть недоступні, якщо ви не зареєструєтесь в Search Labs. Але велика нова функція під назвою AI Overviews, яку компанія тестувала протягом року, нарешті буде доступна мільйонам людей у США.
Відтепер у Пошуку Google відповіді, згенеровані штучним інтелектом, за замовчуванням відображатимуться поверх результатів, і компанія заявляє, що до кінця року ця функція стане доступною для понад мільярда користувачів по всьому світу.
Google інтегрує Gemini безпосередньо в Android. Коли Android 15 вийде пізніше цього року, Gemini буде знати про програму, зображення або відео, які ви запускаєте, і ви зможете поставити ШІ контекстно-залежні запитання. Це, вочевидь, буде схоже на Google Assistant.
Застосунок для ведення записів NotebookLM отримає доступ до Gemini 1.5 Pro, і, судячи з демонстрації, показаної на I/O 2024, стане непоганим вчителем. На демонстрації показали, як застосунок завантажує нотатки на навчальну тему і створює детальний навчальний посібник, з додатковими матеріалами, включаючи вікторини та запитання, взяті з вихідного матеріалу. Також він отримає підтримку аудіо, створюючи дискусію в стилі подкасту і пояснюючи тему.
Було також багато інших оновлень. Google заявила, що додасть цифрові водяні знаки до відео і тексту, створених штучним інтелектом, зробить Gemini доступним на бічній панелі в Gmail і Docs, включить віртуального колегу по команді в Workspace, аналізуватиме телефонні розмови в режимі реального часу і визначатиме, чи не намагаються вас обдурити тощо.
Читайте також:
Leave a Reply