Отже, за останні півтора року ми стали свідками стрімкого зростання генеративного ШІ, а моделі ШІ з кожною хвилиною, здається, отримують все більше і більше знань. Так, повідомляється, що нова модель штучного інтелекту від Google, Gemini 1.5 Pro, тепер може слухати та розуміти аудіофайли.
Чим більше даних ви надаєте штучному інтелекту, тим кращим він стає (і більш лякаючим, якщо ви скептично налаштовані щодо цього). Спочатку навчання ШІ-моделей відбувалося в основному за допомогою тексту – особливо важливо для чат-ботів. Однак згодом ШІ-моделі навчилися обробляти дані зображень, і тепер їх можна використовувати для реконструкції зображення (або створення абсолютно нового зображення за вашим запитом).
ШІ-модель Gemini (яка раніше називалася Bard) навчилася обробляти зображення (хоча створення деяких зображень нещодавно призвело мало не до скандалу), і тепер вона розвивається в напрямку розуміння аудіофайлів. Версія Gemini 1.5 Pro, яка робить це, наразі перебуває на стадії тестування і вважається навіть потужнішою за Gemini Ultra.
Успішна реалізація цієї функції відкриє для користувачів безліч нових можливостей – наприклад, значна економія часу завдяки створенню резюме довгої доповіді, бесіди, телефонного дзвінка, лекції та інших подібних речей. Для цього потрібно буде лише завантажити файл до Gemini. Інструменти для конспектування довгих дзвінків існують, але вони спочатку транскрибують дзвінок, а потім створюють резюме. Однак Gemini достатньо його просто прослухати.
Звісно ж, є нюанс – поки що ця функція не буде загальнодоступною. Щоб отримати до неї доступ, користувачам знадобиться платформа для розробки Vertex AI від Google або AI Studio. У компанії говорять, що пізніше вона стане загальнодоступним, але жодних термінів не надають.
Загалом, спостерігати за розвитком штучного інтелекту дуже цікаво. Він вже допомагає зробити наше життя простішим і дає нам більше простору для реалізації творчого потенціалу, а з цією функцією ще й дозволить економити дорогоцінний час. Але якщо ваше “спілкування” з чат-ботами зі ШІ раніше було виключно неефективним, можливо, варто попрацювати над запитами.
Google опублікувала посібник, який допомагає користувачам ефективно структурувати запит-підказку, щоб отримати максимальну віддачу від чат-бота, такого як Gemini. Посібник радить завжди вказувати у підказці щось про себе, писати не просто завдання, а додавати деталі, просити маркований список. Окремі завдання радять розбивати на окремі підказки, додавати конкретні вимоги щодо списків чи кількості символів, просити виконати це у певному тоні. Можна навіть запитати у чат-бота, чи немає у нього до вас уточнюючих питань, щоб він міг краще зрозуміти завдання.
Посібник додає, що підказки повинні бути написані природно, “повними думками в повних реченнях”, а “найуспішніші підказки в середньому складаються з 21 слова”.
Читайте також:
Leave a Reply