Root NationNoviceIT noviceNovi Googlov model Gemini AI bo lahko poslušal zvočne datoteke

Novi Googlov model Gemini AI bo lahko poslušal zvočne datoteke

-

Tako smo v zadnjem letu in pol opazili hitro rast generativne umetne inteligence in zdi se, da modeli umetne inteligence iz minute v minuto pridobivajo vedno več znanja. Tako poročajo, da je nov model umetne inteligence iz google, Gemini 1.5 Pro, lahko zdaj posluša in razume zvočne datoteke.

Več podatkov kot vnesete AI, boljši je (in bolj strašljiv, če ste glede tega skeptični). Sprva je usposabljanje modelov AI potekalo predvsem z besedilom – kar je še posebej pomembno za chatbote. Vendar kasneje AI-modeli so se naučili obdelave slikovnih podatkov in jih je zdaj mogoče uporabiti za rekonstrukcijo slike (ali ustvarjanje popolnoma nove slike na zahtevo).

Google Gemini

Model AI Gemini (prej imenovan Bard) se je naučil obdelovati slike (čeprav je ustvarjanje nekaterih slik nedavno povzročilo skoraj škandal), zdaj pa se razvija v smeri razumevanja zvočnih datotek. Različica Gemini 1.5 Pro, ki to počne, je trenutno v fazi testiranja in naj bi bila celo močnejša od Gemini Ultra.

Uspešna implementacija te funkcije bo uporabnikom odprla številne nove priložnosti - na primer znatne prihranke časa zaradi ustvarjanja povzetka dolgega poročila, pogovora, telefonskega klica, predavanja in drugih podobnih stvari. Vse kar morate storiti je, da naložite datoteko v Gemini. Orodja za snemanje dolgih klicev obstajajo, vendar najprej prepišejo klic in nato ustvarijo povzetek. Vendar je Dvojčku dovolj, da ga poslušate.

Posodobljeni model Google Gemini AI bo lahko poslušal in razumel zvočne datoteke

Seveda obstaja opozorilo - ta funkcija še ne bo javno dostopna. Za dostop do njega bodo uporabniki potrebovali razvojno platformo Vertex AI iz google ali AI Studio. Družba pravi, da bo javno dostopna pozneje, vendar ni podana časovnica.

Na splošno je opazovanje razvoja umetne inteligence zelo zanimivo. Že zdaj nam olajša življenje in nam daje več prostora za uresničitev ustvarjalnega potenciala, s to funkcijo pa nam bo omogočil tudi prihranek dragocenega časa. Če pa je bila vaša »komunikacija« s klepetalnimi roboti z umetno inteligenco v preteklosti izjemno neučinkovita, bi bilo morda vredno razmisliti o vaših poizvedbah.

Google je objavil vodnik, ki uporabnikom pomaga učinkovito strukturirati pozive k poizvedbam, da kar najbolje izkoristijo chatbota, kot je Gemini. Priročnik svetuje, da v pozivu vedno navedete nekaj o sebi, da ne napišete le naloge, ampak da dodate podrobnosti, zahtevate označen seznam. Priporočljivo je, da ločene naloge razdelite na ločene pozive, dodate posebne zahteve za sezname ali število znakov, zahtevate, da to storite v določenem tonu. Klepetalnega robota lahko celo vprašate, ali ima za vas kakšna pojasnilna vprašanja, da bo lahko bolje razumel nalogo.

Vodnik dodaja, da morajo biti pozivi napisani naravno, s "popolnimi mislimi v celih stavkih" in da "najuspešnejši pozivi v povprečju obsegajo 21 besed."

Preberite tudi:

Prijavite se
Obvesti o
gost

0 Komentarji
Vdelana mnenja
Prikaži vse komentarje