Što je Gemini: Sve o novom modelu umjetne inteligencije iz Googlea

Google je upravo objavio svoj najmoćniji AI model ikada Blizanci. Što je ona i što može? O svemu u našem članku.

Google već godinama razvija vlastite AI alate. Uz javno izdanje ChatGPT-3 iz OpenAI-ja, tvrtka koja upravlja najpopularnijom tražilicom na svijetu također je stvorila sličan alat, Bard. Ali ovaj je alat ipak izgubio od konkurenata, što Google nije mogao dopustiti. Stoga ne čudi što je svijet nedavno ugledao Gemini, novi jezični model iz Googlea, o kojem smo saznali tijekom prezentacije.

Dizajniran je ne samo da poboljša prethodni LLM (Large Language Model) diva, već i da ponudi potpuno nove mogućnosti u području obrade teksta, grafike i zvuka.

Dakle, pogledajmo pobliže novi jezični model Google Gemini.

Također zanimljivo: OpenAI Project Q*: što je to i zašto je projekt zabrinjavajući

SADRŽAJ

1. Što je Google Gemini?

2. Tko je stvorio model?

3. Mogućnosti

4. Postoje li različite verzije?

5. Kako pristupiti Geminiju?

6. Gemini u Google Bardu: Što će se promijeniti?

7. Gemini u Google Pixel pametnim telefonima

8. Po čemu se Gemini razlikuje od ostalih AI modela, poput GPT-4?

9. Zabrinutost oko točnosti i nepristranosti

10. Budućnost je s Blizancima

Što je Google Gemini?

Ovo je novi i moćni model umjetne inteligencije iz Googlea, koji može razumjeti ne samo tekst, već i slike, video i audio. Ovaj multimodalni model opisan je kao sposoban za obavljanje složenih zadataka u matematici, fizici i drugim domenama, kao i za razumijevanje i generiranje visokokvalitetnog koda u različitim programskim jezicima.

Gemini je trenutno dostupan kroz integraciju s Google Bardom i Google Pixelom 8 te će postupno biti uključen u ostale Googleove usluge.

"Gemini je rezultat golemog zajedničkog napora svih Google timova, uključujući naše kolege iz Google Researcha," — rekao je Dennis Hassabis, izvršni direktor i suosnivač Google DeepMinda. "Izgrađen je od temelja da bude multimodalan, što znači da može generalizirati i neprimjetno razumjeti, raditi na njima i kombinirati različite vrste informacija, uključujući tekst, kod, zvuk, slike i video."

- Oglašavanje -

Također zanimljivo: Nije sve što nazivamo AI zapravo umjetna inteligencija. Evo što trebate znati

Tko je stvorio model?

Kao što ste vjerojatno već pogodili, Gemini su stvorili Google i Alphabet, Googleova matična tvrtka, i to je najnapredniji AI model tvrtke do sada. Značajan doprinos njegovom razvoju dao je i Googleov odjel DeepMind. Još nije poznato koliko je zaposlenika sudjelovalo u razvoju i koja su sredstva izdvojena za to, ali poznavajući Googleove mogućnosti, možemo biti sigurni da je riječ o vrlo velikom iznosu.

Također zanimljivo: Windows 12: Koji će biti novi OS

Mogućnosti

Kao što sam gore napomenuo, to je multimodalni model, što znači da može razumjeti, raditi na i kombinirati različite vrste podataka, uključujući tekst, kod, zvuk, slike i video. Omogućuje bolje razumijevanje, razmišljanje i vještine kodiranja u usporedbi s prethodnim AI sustavima.

Glavne mogućnosti modela su:

Obrada prirodnog jezika za zadatke kao što su prijevod, sažimanje i dijalog
Matematičko razmišljanje i rješavanje problema
Sposobnost generiranja koda i dokumentacije
Razumijevanje slika, zvuka i videa
Multitasking u različitim domenama

Kao što vidite, mogućnosti su superiornije u odnosu na druge modele.

U testovima razumijevanja jezika, matematičkog razmišljanja i kodiranja, Gemini Ultra nadmašio je modele poput GPT-4. Konkretno, to je prvi model koji nadmašuje izvedbu na ljudskoj razini na Massive Multitask Language Understanding (MMLU) testu, postižući preko 90% točnosti.

U 32 akademska testa velike studije jezičnog modela, Gemini je nadmašio GPT-4. U 30 slučajeva novi jezični model iz Googlea bio je bolji od konkurenta. Ovo pokazuje sposobnost modela da u potpunosti razumije jezik.

Pročitajte također: Projekt ljudskog mozga: pokušaj oponašanja ljudskog mozga

Postoje li različite verzije?

Google opisuje ovaj AI kao fleksibilan model koji može raditi na bilo kojem uređaju: od Google podatkovnih centara do mobilnih uređaja. Kako bi se postigla ova skalabilnost, Gemini dolazi u tri verzije: Nano, Pro i Ultra.

Razgovarajmo detaljnije o različitim verzijama Blizanaca.

Blizanci Nano: dizajniran za rad na pametnim telefonima, posebno Google Pixel 8. Dizajniran je za obavljanje zadataka koji zahtijevaju učinkovitu obradu od strane umjetne inteligencije bez povezivanja s vanjskim poslužiteljima, kao što je predlaganje odgovora u programima za chat ili sažimanje teksta. Ovaj kompaktni model uređaja ima oko 6 milijardi parametara.
Blizanci Pro: radi u Google podatkovnim centrima. Pro je dizajniran za rad s najnovijom verzijom Bard AI chatbota. Može pružiti brzo vrijeme odgovora i razumjeti složene upite. Model srednje veličine ima približno 100 milijardi parametara i jezgra je Bardove konverzacijske AI. Pro će biti dostupan putem Google Clouda.
Gemini Ultra: iako Ultra verzija još nije široko dostupna, Google ju opisuje kao svoj model s najboljom izvedbom, nadmašujući "trenutačno stanje tehnike za 30 od 32 široko korištena akademska testa koji se koriste u istraživanju velikog jezičnog modela (LLM). " Kao najveća i najmoćnija verzija, Ultra će dobiti više od 1 trilijun parametara. Nalazit će se u podatkovnim centrima. Ultra je prilagođen za korporativnu upotrebu. Verzija je dizajnirana za obavljanje vrlo složenih zadataka. Google ga planira objaviti nakon završetka trenutne faze testiranja. Odnosno, najjača verzija još nije dostupna korisnicima.

Također zanimljivo: Google Bard AI: Sve što trebate znati

- Oglašavanje -

Kako pristupiti Geminiju?

AI u verzijama Nano i Pro sada je dostupan u Googleovim proizvodima kao što su pametni telefoni Google Pixel 8 i chatbot Bard. Google ga planira s vremenom integrirati u svoju tražilicu, oglašavanje, uslugu e-pošte Gmail, preglednik Chrome i druge usluge.

Razvojni programeri i poslovni korisnici moći će pristupiti Pro-u putem Gemini API-ja u Google AI Studiju i Google Cloud Vertex AI-u od 13. prosinca 2023. Programeri Android imat će pristup modelu Nano verzije putem AICorea, koji će biti dostupan u ranom pregledu.

Pročitajte također: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Bitka dva Yokozuna

Gemini u Google Bardu: Što će se promijeniti?

Prema informacijama danim tijekom prezentacije, model će omogućiti Google Bardu da se bolje nosi sa složenijim problemima, kao što je navedeno:

“Dizajnirali smo Gemini tako da je model prirodno multimodalan i unaprijed obučen na više modaliteta od samog početka. Zatim smo ga doradili dodavanjem više multimodalnih podataka kako bismo poboljšali izvedbu. Kao rezultat toga, Gemini s lakoćom razumije i zaključuje puno bolje od prethodnih multimodalnih modela, te se može pohvaliti najsuvremenijim mogućnostima u gotovo svim područjima.

Geminijeve izvanredne multimodalne mogućnosti pomažu vam razumjeti složene tekstualne i vizualne informacije. Osobito su korisni kada se radi o izvlačenju specifičnih informacija iz ogromnih skupova podataka. Izvanredna sposobnost ovog modela da izvuče suštinu informacija iz stotina tisuća dokumenata njihovim čitanjem, filtriranjem i analizom nedvojbeno će pridonijeti novim, munjevitim otkrićima u raznim područjima od znanosti do financija."

Tijekom prezentacije prikazan je primjer složene studije koja sadrži više od 200 tisuća zapisa od kojih je neke trebalo ažurirati prema novim podacima. Kao što ste mogli pretpostaviti, ručno izvođenje ovoga oduzimalo bi mnogo vremena, pa su autori studije koristili Gemini za pripremu koda koji je uzimao unos i napravio potrebna ažuriranja. Drugi, stvarniji primjer je korištenje Googleovog jezičnog modela za objašnjenje matematičkih ili fizičkih problema.

Ovdje je ulazni podatak bila fotografija/sken zadaće sa školskog sata. Sustav je mogao obraditi grafiku i tekst koji su tamo pohranjeni i zatim pokazati koji su dijelovi domaće zadaće ispravno obavljeni, a kojima je potrebno više pažnje. Prezentacija je pokazala da korisnik može više puta tražiti od Geminija objašnjenje zadatka, a svaki sljedeći pokušaj mora biti objašnjen jednostavnijim jezikom. Koliko će Gemini biti precizan i korektan, provjerit će naravno zainteresirani, no impresivna je mogućnost čitanja i obrade teksta izravno s fotografija. Kao što je dodano tijekom prezentacije:

"Blizanci su naučeni da prepoznaju i razumiju tekst, slike, zvukove i više u isto vrijeme. Zahvaljujući tome, on bolje razumije nijanse informacija i može odgovoriti na složena pitanja. Osobito je učinkovit u objašnjavanju tema vezanih uz matematiku i fiziku, pa može poslužiti i kao osobni pomoćnik u zadaći".

Gemini u Google Pixel pametnim telefonima

Google se također pohvalio da je Gemini "učio" na novim TPUv5 čipsetima, te planira predstaviti Gemini Ultra početkom 2024. godine, koji će koristiti Bard Advanced, novu verziju potrošačke verzije govornog modela diva. Gemini Ultra trenutno je u fazi testiranja i već je dostupan odabranim sigurnosnim stručnjacima.

Posljednja važna informacija je uvođenje Geminija u pametne telefone Google Pixel 8. To će omogućiti, između ostalog, kreiranje brzih odgovora putem Gboard aplikacije u messengerima. Prvi je WhatsApp, no iduće godine takva će se rješenja pojaviti i u drugim aplikacijama vezanim uz komunikaciju. No, ovo je tek početak, budući da je Google najavio mnogo novih AI alata za Pixel 8 pametne telefone, a bit će dostupni i na nekim drugim uređajima u budućnosti. Android. Međutim, to su daljnji planovi i za sada nema detalja.

Po čemu se Gemini razlikuje od ostalih AI modela, poput GPT-4?

Googleov novi model Gemini izgleda kao jedan od najvećih i najnaprednijih modela umjetne inteligencije do danas, iako će izdanje modela Ultra to sigurno odrediti. U usporedbi s drugim popularnim modelima koji trenutno koriste AI chatbotove, Gemini se ističe vlastitom multimodalnom značajkom, dok se drugi modeli poput GPT-4 oslanjaju na dodatke i integraciju kako bi bili uistinu multimodalni.

Zabrinutost oko točnosti i nepristranosti

Iako je Gemini veliki korak naprijed u razvoju sposobnosti umjetne inteligencije, ima iste nedostatke kao i drugi glavni jezični modeli. Prije svega, to je mogućnost stvaranja lažnih informacija. Pristranosti se također temelje na podacima o obuci dostupnim novom jezičnom modelu. Također je vrijedno spomenuti ograničeno razumijevanje stvarnog svijeta. Google priznaje da novi model Gemini može pogriješiti, pružiti činjenice koje se ne temelje na dokazima i proturječe zdravom razumu.

Potrebno je više testova, posebno za Gemini Ultra, koji ima nove mogućnosti koje još nisu u potpunosti istražene. Google je predan pažljivoj procjeni Geminija kako bi smanjio potencijalnu štetu.

Također zanimljivo: Sve o Microsoft Kopilot: budućnost ili krivi put?

Budućnost je s Blizancima

Googleovo lansiranje Geminija otvorilo je novu eru razvoja umjetne inteligencije. Sa svojim najboljim performansama u usporedbi s prethodnim modelima i ljudskim osnovnim vrijednostima, Gemini ukazuje na buduće mogućnosti umjetne inteligencije, ali još treba više istraživanja kako bi se riješili određeni nedostaci.

U budućnosti možete očekivati da će Gemini pružiti korisnije i inteligentnije značajke u Googleovim proizvodima. Ubuduće, tvrtka planira nastaviti širiti Gemini izvan engleskog jezika i graditi na svojoj osnovnoj metodologiji modela.

Možemo samo gledati i nadati se da Google zna što radi.

Pročitajte također:

Više od autora

Prijavite se

0 Komentari

Ugrađene recenzije

Pogledaj sve komentare

Ostali članci

Što je Gemini: Sve o Googleovom novom AI modelu