Root NationNyheterIT-nyheterDen nye Gemini AI-modellen fra Google vil kunne lytte til lydfiler

Den nye Gemini AI-modellen fra Google vil kunne lytte til lydfiler

-

Så i løpet av det siste og et halvt året har vi sett en rask vekst i generativ AI, og AI-modeller ser ut til å få mer og mer kunnskap for hvert minutt. Så er det rapportert at en ny modell for kunstig intelligens fra Google, Gemini 1.5 Pro, kan nå lytte til og forstå lydfiler.

Jo mer data du mater AI, jo bedre blir den (og jo skumlere hvis du er skeptisk til det). Opprinnelig ble opplæring av AI-modeller hovedsakelig gjort med tekst – spesielt viktig for chatbots. Imidlertid senere AI-modeller har lært å behandle bildedata og kan nå brukes til å rekonstruere et bilde (eller lage et helt nytt bilde på forespørsel).

Google Gemini

AI-modellen Gemini (tidligere kalt Bard) har lært seg å behandle bilder (selv om å lage noen bilder nylig resulterte i nesten skandale), og nå utvikler den seg i retning av å forstå lydfiler. Gemini 1.5 Pro-versjonen som gjør dette er for tiden under testing og sies å være enda kraftigere enn Gemini Ultra.

Den vellykkede implementeringen av denne funksjonen vil åpne mange nye muligheter for brukere - for eksempel betydelige tidsbesparelser på grunn av opprettelsen av et sammendrag av en lang rapport, samtale, telefonsamtale, foredrag og andre lignende ting. Alt du trenger å gjøre er å laste opp filen til Gemini. Det finnes verktøy for opptak av lange samtaler, men de transkriberer først samtalen og lager deretter et sammendrag. Imidlertid er Gemini nok bare å lytte til den.

Den oppdaterte Google Gemini AI-modellen vil kunne lytte og forstå lydfiler

Selvfølgelig er det et forbehold - denne funksjonen vil ikke være offentlig tilgjengelig ennå. For å få tilgang til den, trenger brukere Vertex AI-utviklingsplattformen fra Google eller AI Studio. Selskapet sier at det vil bli offentlig tilgjengelig senere, men ingen tidslinje er gitt.

Generelt er det veldig interessant å se utviklingen av kunstig intelligens. Det bidrar allerede til å gjøre livene våre enklere og gir oss mer plass til å realisere vårt kreative potensial, og med denne funksjonen vil det også tillate oss å spare dyrebar tid. Men hvis "kommunikasjonen" din med AI chatbots har vært ekstremt ineffektiv tidligere, kan det være verdt å jobbe med spørsmålene dine.

Google har publisert en guide for å hjelpe brukere med å effektivt strukturere spørringer for å få mest mulig ut av en chatbot som Gemini. Håndboken anbefaler å alltid angi noe om deg selv i ledeteksten, å skrive ikke bare en oppgave, men å legge til detaljer, å be om en markert liste. Separate oppgaver anbefales å deles ned i separate spørsmål, legg til spesifikke krav til lister eller antall tegn, be om å gjøre det i en viss tone. Du kan til og med spørre chatboten om den har noen oppklarende spørsmål til deg slik at den bedre kan forstå oppgaven.

Guiden legger til at spørsmål bør skrives naturlig, med "fullstendige tanker i fullstendige setninger," og at "de mest vellykkede ledetekstene i gjennomsnitt 21 ord."

Les også:

Dzherelotelefonarena
Melde deg på
Gi beskjed om
gjest

0 Kommentar
Innebygde anmeldelser
Se alle kommentarer