Ce este Gemeni: Totul despre noul model AI de la Google

Google tocmai a lansat cel mai puternic model AI numit vreodată zodia Gemeni. Ce este ea și ce poate face? Despre totul în articolul nostru.

Google și-a dezvoltat propriile instrumente AI de ani de zile. Odată cu lansarea publică a ChatGPT-3 de la OpenAI, compania care conduce cel mai popular motor de căutare din lume a creat și un instrument similar, Bard. Dar acest instrument a pierdut în continuare în fața concurenților, ceea ce Google nu a putut permite. Prin urmare, nu este de mirare că lumea a văzut recent Gemeni, un nou model de limbă de la Google, despre care am aflat în timpul prezentării.

Este conceput nu numai pentru a îmbunătăți LLM-ul anterior (Large Language Model) al gigantului, ci și pentru a oferi posibilități complet noi în domeniul procesării textului, graficii și sunetului.

Deci, să aruncăm o privire mai atentă la noul model de limbaj Google Gemini.

Interesant de asemenea: OpenAI Project Q*: ce este și de ce proiectul este o preocupare

CONŢINUT

1. Ce este Google Gemini?

2. Cine a creat modelul?

3. Oportunități

4. Există versiuni diferite?

5. Cum să accesezi Gemeni?

6. Gemeni la Google Bard: Ce se va schimba?

7. Gemeni pe smartphone-urile Google Pixel

8. Cum este Gemini diferit de alte modele AI, cum ar fi GPT-4?

9. Preocupări cu privire la acuratețe și imparțialitate

10. Viitorul este cu Gemeni

Ce este Google Gemini?

Acesta este un model nou și puternic de inteligență artificială de la Google, care poate înțelege nu numai text, ci și imagini, videoclipuri și audio. Acest model multimodal este descris ca fiind capabil să îndeplinească sarcini complexe în matematică, fizică și alte domenii, precum și să înțeleagă și să genereze cod de înaltă calitate într-o varietate de limbaje de programare.

Gemeni este disponibil momentan prin integrarea cu Google Bard și Google Pixel 8 și va fi inclus treptat în alte servicii Google.

„Gemenii este rezultatul unui efort masiv de colaborare între echipele Google, inclusiv colegii noștri de la Google Research”, — a declarat Dennis Hassabis, CEO și co-fondator al Google DeepMind. „A fost construit de la zero pentru a fi multimodal, ceea ce înseamnă că poate generaliza și înțelege fără probleme, opera și combina diferite tipuri de informații, inclusiv text, cod, audio, imagini și video.”

- Publicitate -

Interesant de asemenea: Nu tot ceea ce numim AI este de fapt inteligență artificială. Iată ce trebuie să știți

Cine a creat modelul?

După cum probabil ați ghicit deja, Gemini a fost creat de Google și Alphabet, compania-mamă a Google, și este cel mai avansat model AI al companiei până în prezent. Divizia DeepMind a Google a avut, de asemenea, o contribuție semnificativă la dezvoltarea sa. Nu se știe încă câți angajați au participat la dezvoltare și ce fonduri au fost alocate pentru aceasta, dar cunoscând capacitățile Google, putem fi siguri că există o sumă foarte mare.

Interesant de asemenea: Windows 12: Care va fi noul sistem de operare

Oportunități

După cum am menționat mai sus, este un model multimodal, ceea ce înseamnă că poate înțelege, opera și combina diferite tipuri de date, inclusiv text, cod, audio, imagini și video. Oferă abilități de înțelegere, gândire și codare mai bune în comparație cu sistemele AI anterioare.

Capacitățile principale ale modelului sunt:

Procesarea limbajului natural pentru sarcini precum traducerea, rezumarea și dialogul
Gândire matematică și rezolvare de probleme
Abilitatea de a genera cod și documentație
Înțelegerea imaginilor, audio și video
Multitasking în diferite domenii

După cum puteți vedea, capacitățile sunt superioare celorlalte modele.

În testele de înțelegere a limbajului, gândire matematică și codificare, Gemini Ultra a depășit modele precum GPT-4. În special, este primul model care depășește performanța la nivel uman la testul Massive Multitask Language Understanding (MMLU), obținând o precizie de peste 90%.

În 32 de teste academice ale unui studiu de model lingvistic mare, Gemeni a depășit GPT-4. În 30 de cazuri, noul model de limbă de la Google a fost mai bun decât concurentul. Acest lucru demonstrează capacitatea modelului de a înțelege pe deplin limbajul.

Citeste si: Human Brain Project: O încercare de a imita creierul uman

Există versiuni diferite?

Google descrie această inteligență artificială ca un model flexibil care poate funcționa pe orice dispozitiv: de la centrele de date Google până la dispozitivele mobile. Pentru a obține această scalabilitate, Gemini vine în trei versiuni: Nano, Pro și Ultra.

Să vorbim mai detaliat despre diferitele versiuni ale lui Gemeni.

Gemeni Nano: conceput pentru a funcționa pe smartphone-uri, în special pe Google Pixel 8. Este conceput pentru a îndeplini sarcini care necesită procesare eficientă de către inteligența artificială fără a se conecta la servere externe, cum ar fi sugerarea de răspunsuri în programele de chat sau rezumarea textului. Acest model de dispozitiv compact are aproximativ 6 miliarde de parametri.
Gemeni Pro: rulează în centrele de date Google. Pro este proiectat să funcționeze cu cea mai recentă versiune a chatbot-ului Bard AI. Este capabil să ofere timpi de răspuns rapid și să înțeleagă interogările complexe. Un model de dimensiuni medii are aproximativ 100 de miliarde de parametri și este nucleul AI conversațional al lui Bard. Pro va fi disponibil prin Google Cloud.
Gemeni Ultra: deși versiunea Ultra nu este încă disponibilă pe scară largă, Google o descrie ca fiind modelul său cel mai performant, depășind „starea actuală a tehnicii pentru 30 din 32 de teste academice utilizate pe scară largă în cercetarea modelului lingvistic mare (LLM). " Fiind cea mai mare și mai puternică versiune, Ultra va primi mai mult de 1 trilion de parametri. Acesta va fi amplasat în centre de date. Ultra este adaptat pentru uz corporativ. Versiunea este concepută pentru a îndeplini sarcini foarte complexe. Google plănuiește să-l lanseze după sfârșitul fazei actuale de testare. Adică, cea mai puternică versiune nu este încă disponibilă pentru utilizatori.

Interesant de asemenea: Google Bard AI: Tot ce trebuie să știți

- Publicitate -

Cum să accesezi Gemeni?

AI în versiunile Nano și Pro sunt acum disponibile în produsele Google, cum ar fi smartphone-urile Google Pixel 8 și, respectiv, chatbot-ul Bard. Google intenționează să îl integreze în cele din urmă în motorul său de căutare, publicitate, serviciul de e-mail Gmail, browserul Chrome și alte servicii.

Dezvoltatorii și clienții întreprinderilor vor putea accesa Pro prin API-ul Gemini în Google AI Studio și Google Cloud Vertex AI începând cu 13 decembrie 2023. Dezvoltatori Android va avea acces la modelul versiunii Nano prin AICore, care va fi disponibil într-o previzualizare anticipată.

Citeste si: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Bătălia celor doi Yokozun

Gemeni la Google Bard: Ce se va schimba?

Conform informațiilor furnizate în timpul prezentării, modelul va permite Google Bard să gestioneze mai bine probleme mai complexe, după cum se spune:

„Am proiectat Gemini astfel încât modelul să fie în mod natural multimodal și pre-antrenat pe mai multe modalități încă de la început. Apoi l-am rafinat adăugând mai multe date multimodale pentru a îmbunătăți performanța. Drept urmare, Gemeni înțelege și deduce cu ușurință mult mai bine decât modelele multimodale anterioare și se mândrește cu capabilități de ultimă generație în aproape toate domeniile.

Capacitățile multimodale extraordinare ale Gemeni vă ajută să înțelegeți informațiile textuale și vizuale complexe. Sunt utile în special atunci când vine vorba de extragerea de informații specifice din seturi uriașe de date. Capacitatea extraordinară a acestui model de a extrage esența informațiilor din sute de mii de documente prin citirea, filtrarea și analizarea acestora va contribui, fără îndoială, la descoperiri noi, fulgerătoare, în diverse domenii, de la știință la finanțe.”

În cadrul prezentării a fost demonstrat un exemplu de studiu complex, care conține peste 200 de mii de înregistrări, dintre care unele au trebuit actualizate în funcție de date noi. După cum probabil ați ghicit, a face acest lucru manual ar consuma foarte mult timp, așa că autorii studiului au folosit Gemini pentru a pregăti codul care a preluat intrarea și a făcut actualizările necesare. Un alt exemplu, mai real, este utilizarea modelului de limbaj Google pentru a explica probleme de matematică sau fizică.

Datele introduse aici au fost o fotografie/scanare a unei teme de la o lecție de la școală. Sistemul a putut să proceseze grafica și textul stocat acolo și apoi să indice ce părți ale temei au fost făcute corect și care au avut nevoie de mai multă atenție. Prezentarea a arătat că un utilizator îi poate cere în mod repetat lui Gemeni să explice o sarcină, iar fiecare încercare ulterioară trebuie explicată într-un limbaj mai simplu. Cât de precis și corect vor fi Gemenii, desigur, vor fi verificați de cei interesați, dar capacitatea de a citi și procesa text direct din fotografii este impresionantă. După cum a fost adăugat în timpul prezentării:

Gemenii au fost învățați să recunoască și să înțeleagă text, imagini, sunete și multe altele în același timp. Datorită acestui fapt, înțelege mai bine nuanțele informațiilor și poate răspunde la întrebări complexe. Este deosebit de eficient în explicarea subiectelor legate de matematică și fizică, astfel încât poate servi ca ajutor personal pentru teme.".

Gemeni pe smartphone-urile Google Pixel

Google s-a lăudat, de asemenea, că Gemini a „învățat” pe noile chipset-uri TPUv5 și intenționează să introducă Gemini Ultra la începutul lui 2024, care va folosi Bard Advanced, o nouă versiune a versiunii pentru consumatori a modelului de vorbire al gigantului. Gemini Ultra este în prezent în testare și este deja disponibil pentru selectarea experților în securitate.

Ultima informație importantă este introducerea lui Gemini în smartphone-urile Google Pixel 8. Aceasta va permite, printre altele, crearea de răspunsuri rapide prin intermediul aplicației Gboard în messengers. Primul este WhatsApp, dar anul viitor astfel de soluții vor apărea și în alte aplicații legate de comunicare. Cu toate acestea, acesta este doar începutul, deoarece Google a anunțat multe noi instrumente AI pentru smartphone-urile Pixel 8, iar acestea vor fi disponibile pe alte dispozitive în viitor. Android. Cu toate acestea, acestea sunt alte planuri și nu au fost furnizate detalii în acest moment.

Cum este Gemini diferit de alte modele AI, cum ar fi GPT-4?

Noul model Gemini de la Google pare a fi unul dintre cele mai mari și mai avansate modele AI de până acum, deși lansarea modelului Ultra va determina acest lucru cu siguranță. În comparație cu alte modele populare care utilizează în prezent chatbot-uri AI, Gemini se remarcă prin propria sa caracteristică multimodală, în timp ce alte modele precum GPT-4 se bazează pe pluginuri și pe integrare pentru a fi cu adevărat multimodale.

Preocupări cu privire la acuratețe și imparțialitate

Deși Gemenii reprezintă un salt înainte major în dezvoltarea capacităților de inteligență artificială, are aceleași neajunsuri ca și alte modele majore de limbaj. În primul rând, aceasta este posibilitatea de a crea informații false. Prejudecățile se bazează, de asemenea, pe datele de antrenament disponibile pentru noul model lingvistic. De asemenea, merită menționată înțelegerea limitată a lumii reale. Google admite că noul model Gemeni poate face greșeli, poate oferi fapte care nu se bazează pe dovezi și contrazice bunul simț.

Sunt necesare mai multe teste, în special pentru Gemini Ultra, care are noi capabilități care nu au fost încă explorate pe deplin. Google se angajează să evalueze cu atenție Gemeni pentru a minimiza potențialul rău.

Interesant de asemenea: Totul despre Microsoft Copilotul: viitorul sau drumul greșit?

Viitorul este cu Gemeni

Lansarea Gemini de către Google a inaugurat o nouă eră a dezvoltării AI. Cu cele mai bune performanțe în comparație cu modelele anterioare și cu liniile de bază umane, Gemeni indică posibilitățile viitoare ale inteligenței artificiale, dar încă are nevoie de mai multe cercetări pentru a rezolva anumite deficiențe.

În viitor, vă puteți aștepta ca Gemini să ofere funcții mai utile și mai inteligente în produsele Google. În continuare, compania intenționează să continue să extindă Gemini dincolo de limba engleză și să se bazeze pe metodologia sa de bază a modelului.

Putem doar să urmărim și să sperăm că Google știe ce face.

Citeste si:

Mai multe de la autor

Inscrie-te

0 Comentarii

Recenzii încorporate

Vezi toate comentariile

Alte articole

Ce este Gemeni: Totul despre noul model AI al Google