Root NationNyhederIT nyhederDen nye Gemini AI-model fra Google vil være i stand til at lytte til lydfiler

Den nye Gemini AI-model fra Google vil være i stand til at lytte til lydfiler

-

Så i løbet af det sidste halvandet år har vi set hurtig vækst i generativ AI, og AI-modeller ser ud til at få mere og mere viden fra minut til minut. Så det er rapporteret, at en ny model for kunstig intelligens fra Google, Gemini 1.5 Pro, kan nu lytte til og forstå lydfiler.

Jo flere data du fodrer med AI, jo bedre bliver den (og jo mere skræmmende, hvis du er skeptisk over for det). Oprindeligt foregik træning af AI-modeller hovedsageligt med tekst – især vigtigt for chatbots. Dog senere AI-modeller har lært at behandle billeddata og kan nu bruges til at rekonstruere et billede (eller oprette et helt nyt billede efter anmodning).

Google Gemini

AI-modellen Gemini (tidligere kaldet Bard) har lært at behandle billeder (selvom at skabe nogle billeder for nylig resulterede i næsten skandale), og nu udvikler det sig i retning af at forstå lydfiler. Gemini 1.5 Pro-versionen, der gør dette, er i øjeblikket i test og siges at være endnu mere kraftfuld end Gemini Ultra.

Den vellykkede implementering af denne funktion vil åbne mange nye muligheder for brugerne - for eksempel betydelige tidsbesparelser på grund af oprettelsen af ​​et resumé af en lang rapport, samtale, telefonopkald, foredrag og andre lignende ting. Alt du skal gøre er at uploade filen til Gemini. Der findes værktøjer til lange opkaldsnoter, men de transskriberer først opkaldet og opretter derefter en oversigt. Gemini er dog nok bare at lytte til den.

Den opdaterede Google Gemini AI-model vil være i stand til at lytte og forstå lydfiler

Selvfølgelig er der en advarsel - denne funktion vil ikke være offentligt tilgængelig endnu. For at få adgang til den skal brugere have Vertex AI-udviklingsplatformen fra Google eller AI Studio. Selskabet siger, at det vil blive offentligt tilgængeligt senere, men der er ikke givet nogen tidslinje.

Generelt er det meget interessant at se udviklingen af ​​kunstig intelligens. Det er allerede med til at gøre vores liv lettere og giver os mere plads til at realisere vores kreative potentiale, og med denne funktion vil det også give os mulighed for at spare kostbar tid. Men hvis din "kommunikation" med AI-chatbots tidligere har været ekstremt ineffektiv, kan det være værd at arbejde på dine forespørgsler.

Google har udgivet en guide til at hjælpe brugere med effektivt at strukturere forespørgsler for at få mest muligt ud af en chatbot som f.eks. Gemini. Manualen råder til altid at angive noget om dig selv i prompten, at skrive ikke bare en opgave, men at tilføje detaljer, at bede om en markeret liste. Separate opgaver anbefales at blive opdelt i separate prompter, tilføje specifikke krav til lister eller antal tegn, bede om at gøre det i en bestemt tone. Du kan endda spørge chatbotten, om den har nogle afklarende spørgsmål til dig, så den bedre kan forstå opgaven.

Vejledningen tilføjer, at prompter skal skrives naturligt med "fuldstændige tanker i komplette sætninger", og at "de mest vellykkede prompter i gennemsnit 21 ord."

Læs også:

Dzherelotelefonarena
Tilmelde
Giv besked om
gæst

0 Kommentarer
Indlejrede anmeldelser
Se alle kommentarer