Root NationНовиниIT новиниНовият модел Gemini AI от Google ще може да слуша аудио файлове

Новият модел Gemini AI от Google ще може да слуша аудио файлове

-

И така, през последната година и половина видяхме бърз растеж на генеративния AI и моделите на AI изглежда придобиват все повече знания с всяка минута. Така се съобщава, че нов модел изкуствен интелект от Google, Gemini 1.5 Pro, вече може да слуша и разбира аудио файлове.

Колкото повече данни подавате на AI, толкова по-добър става той (и толкова по-страшен, ако сте скептични относно това). Първоначално обучението на AI модели се извършваше основно с текст – особено важно за чатботовете. Въпреки това по-късно AI-моделите се научиха как да обработват данни за изображения и вече могат да се използват за реконструиране на изображение (или създаване на напълно ново изображение при поискване).

Google Gemini

AI ​​моделът Gemini (по-рано наричан Bard) се е научил да обработва изображения (въпреки че създаването на някои изображения наскоро доведе до почти скандал), а сега се развива в посока разбиране на аудио файлове. Версията Gemini 1.5 Pro, която прави това, в момента се тества и се смята, че е дори по-мощна от Gemini Ultra.

Успешното прилагане на тази функция ще отвори много нови възможности за потребителите - например значителни спестявания на време поради създаването на резюме на дълъг доклад, разговор, телефонно обаждане, лекция и други подобни неща. Всичко, което трябва да направите, е да качите файла в Gemini. Съществуват инструменти за запис на дълги разговори, но те първо транскрибират разговора и след това създават резюме. Близнаците обаче са достатъчни само да го слушат.

Обновеният модел Google Gemini AI ще може да слуша и разбира аудио файлове

Разбира се, има едно предупреждение - тази функция все още няма да бъде публично достъпна. За достъп до него потребителите ще се нуждаят от платформата за разработка на Vertex AI от Google или AI Studio. Компанията казва, че ще стане публично достъпна по-късно, но не се дава времева линия.

Като цяло е много интересно да се наблюдава развитието на изкуствения интелект. Той вече ни помага да улесним живота си и ни дава повече пространство за реализиране на творческия ни потенциал, а с тази функция ще ни позволи и да спестим ценно време. Но ако вашата „комуникация“ с AI chatbots е била изключително неефективна в миналото, може би си струва да поработите върху вашите заявки.

Google публикува ръководство, за да помогне на потребителите ефективно да структурират подканите за заявки, за да извлекат максимума от чатбот като Близнаци. Ръководството съветва винаги да посочвате нещо за себе си в подканата, да пишете не просто задача, а да добавяте подробности, да поискате маркиран списък. Отделните задачи се препоръчва да се разделят на отделни подкани, да се добавят специфични изисквания за списъци или брой знаци, да се иска да се направи с определен тон. Можете дори да попитате чатбота дали има уточняващи въпроси за вас, за да разбере по-добре задачата.

Ръководството добавя, че подканите трябва да бъдат написани естествено, с „пълни мисли в пълни изречения“ и че „най-успешните подкани съдържат средно 21 думи“.

Прочетете също:

Dzherelophonearena
Регистрирай се
Уведомете за
гост

0 Коментари
Вградени рецензии
Вижте всички коментари