Tātad pēdējā pusotra gada laikā mēs esam pieredzējuši strauju ģeneratīvā AI pieaugumu, un šķiet, ka AI modeļi ar katru minūti iegūst arvien vairāk zināšanu. Tātad, tiek ziņots, ka jauns mākslīgā intelekta modelis no google, Gemini 1.5 Pro, tagad var klausīties un saprast audio failus.

Jo vairāk datu ievadāt AI, jo labāk tas kļūst (un jo biedējošāks, ja uz to raugāties skeptiski). Sākotnēji AI modeļu apmācība tika veikta galvenokārt ar tekstu – īpaši svarīgi tērzēšanas robotiem. Tomēr vēlāk AI-modeļi ir iemācījušies apstrādāt attēla datus, un tagad tos var izmantot attēla rekonstrukcijai (vai pēc pieprasījuma izveidot pilnīgi jaunu attēlu).

AI modelis Gemini (agrāk saukts par Bard) ir iemācījies apstrādāt attēlus (lai gan nesen izveidojot dažus attēlus, gandrīz skandāls), un tagad tas attīstās audio failu izpratnes virzienā. Gemini 1.5 Pro versija, kas to dara, pašlaik tiek testēta, un tiek uzskatīts, ka tā ir vēl jaudīgāka nekā Gemini Ultra.

Veiksmīga šīs iespējas ieviešana lietotājiem pavērs daudzas jaunas iespējas – piemēram, ievērojams laika ietaupījums, pateicoties garas atskaites kopsavilkuma izveidei, sarunai, telefonsarunai, lekcijai un citām līdzīgām lietām. Viss, kas jums jādara, ir augšupielādēt failu Gemini. Ir garo zvanu ierakstīšanas rīki, taču tie vispirms atšifrē zvanu un pēc tam izveido kopsavilkumu. Tomēr Dvīņiem pietiek tikai to klausīties.

Protams, ir brīdinājums – šī funkcija vēl nebūs publiski pieejama. Lai tai piekļūtu, lietotājiem būs nepieciešama Vertex AI izstrādes platforma no google vai AI Studio. Uzņēmums saka, ka tas kļūs publiski pieejams vēlāk, taču nav norādīts laika grafiks.

Kopumā vērot mākslīgā intelekta attīstību ir ļoti interesanti. Tas jau palīdz atvieglot mūsu dzīvi un dod mums vairāk vietas, lai realizētu savu radošo potenciālu, un ar šo funkciju tas ļaus arī ietaupīt dārgo laiku. Bet, ja jūsu “saziņa” ar AI tērzēšanas robotiem pagātnē ir bijusi ārkārtīgi neefektīva, iespējams, ir vērts strādāt pie saviem jautājumiem.

Google ir publicējis ceļvedi, lai palīdzētu lietotājiem efektīvi strukturēt vaicājumu uzvednes, lai maksimāli izmantotu tādu tērzēšanas robotu kā Dvīņi. Rokasgrāmata iesaka uzvednē vienmēr kaut ko norādīt par sevi, rakstīt ne tikai uzdevumu, bet pievienot detaļas, lūgt atzīmētu sarakstu. Atsevišķus uzdevumus ieteicams sadalīt atsevišķās uzvednēs, pievienot konkrētas prasības sarakstiem vai rakstzīmju skaitam, lūgt to izdarīt noteiktā tonī. Varat pat jautāt tērzēšanas robotam, vai tam ir kādi precizējoši jautājumi, lai tas varētu labāk izprast uzdevumu.

Rokasgrāmatā piebilsts, ka uzvednes ir jāraksta dabiski, ar "pilnīgām domām pilnos teikumos" un ka "veiksmīgākajās uzvednēs vidēji ir 21 vārds".

Lasi arī:

Jerelotelefonarēna

Pierakstīties

0 komentāri

Iegultās atsauksmes

Skatīt visus komentārus

Citi raksti

Jaunais Gemini AI modelis no Google varēs klausīties audio failus

Jaunākie komentāri