Kas yra Dvyniai: viskas apie naują „Google“ AI modelį

„Google“ ką tik išleido galingiausią kada nors pavadintą AI modelį Dvyniai. Kas ji yra ir ką ji gali padaryti? Apie viską mūsų straipsnyje.

„Google“ daugelį metų kuria savo AI įrankius. Viešai išleidus „ChatGPT-3“ iš „OpenAI“, bendrovė, valdanti populiariausią pasaulyje paieškos variklį, taip pat sukūrė panašų įrankį „Bard“. Tačiau šis įrankis vis tiek pralaimėjo konkurentams, ko „Google“ negalėjo leisti. Todėl nenuostabu, kad neseniai pasaulį išvydo naujas „Google“ kalbos modelis Gemini, apie kurį sužinojome pristatymo metu.

Jis skirtas ne tik patobulinti ankstesnį milžino LLM (Large Language Model), bet ir pasiūlyti visiškai naujas galimybes teksto apdorojimo, grafikos ir garso srityje.

Taigi pažvelkime į naująjį „Google Gemini“ kalbos modelį atidžiau.

Taip pat įdomu: OpenAI Project Q*: kas tai yra ir kodėl projektas kelia susirūpinimą

TURINYS

1. Kas yra Google Gemini?

2. Kas sukūrė modelį?

3. Galimybės

4. Ar yra skirtingų versijų?

5. Kaip pasiekti Dvynius?

6. Dvyniai „Google Bard“: kas pasikeis?

7. Dvyniai „Google Pixel“ išmaniuosiuose telefonuose

8. Kuo Dvyniai skiriasi nuo kitų AI modelių, tokių kaip GPT-4?

9. Susirūpinimas dėl tikslumo ir nešališkumo

10. Ateitis – su Dvyniais

Kas yra Google Gemini?

Tai naujas ir galingas „Google“ dirbtinio intelekto modelis, galintis suprasti ne tik tekstą, bet ir vaizdus, vaizdo įrašus bei garsą. Šis daugiarūšis modelis apibūdinamas kaip galintis atlikti sudėtingas užduotis matematikos, fizikos ir kitose srityse, taip pat suprasti ir generuoti aukštos kokybės kodą įvairiomis programavimo kalbomis.

Šiuo metu „Gemini“ galima įsigyti integruojant su „Google Bard“ ir „Google Pixel 8“ ir palaipsniui bus įtraukta į kitas „Google“ paslaugas.

„Dvyniai yra didžiulių „Google“ komandų, įskaitant mūsų kolegas iš „Google Research“, bendradarbiavimo rezultatas. sakė Dennisas Hassabis, „Google DeepMind“ generalinis direktorius ir vienas iš įkūrėjų. „Jis buvo sukurtas nuo pat pradžių, kad būtų daugiarūšis, tai reiškia, kad jis gali apibendrinti ir sklandžiai suprasti, valdyti ir derinti įvairių tipų informaciją, įskaitant tekstą, kodą, garsą, vaizdus ir vaizdo įrašus.

- Reklama -

Taip pat įdomu: Ne viskas, ką vadiname AI, iš tikrųjų yra dirbtinis intelektas. Štai ką reikia žinoti

Kas sukūrė modelį?

Kaip tikriausiai jau atspėjote, „Gemini“ sukūrė „Google“ ir „Google“ patronuojančioji įmonė „Alphabet“ ir yra iki šiol pažangiausias bendrovės AI modelis. „Google“ „DeepMind“ padalinys taip pat labai prisidėjo prie jos kūrimo. Kol kas nėra žinoma, kiek darbuotojų dalyvavo kūrime ir kokios tam buvo skirtos lėšos, tačiau žinant Google galimybes galime neabejoti, kad suma yra labai didelė.

Taip pat įdomu: „Windows 12“: kokia bus nauja OS

Galimybės

Kaip minėjau aukščiau, tai yra daugiarūšis modelis, ty jis gali suprasti, valdyti ir derinti įvairių tipų duomenis, įskaitant tekstą, kodą, garsą, vaizdus ir vaizdo įrašus. Tai suteikia geresnių supratimo, mąstymo ir kodavimo įgūdžių, palyginti su ankstesnėmis AI sistemomis.

Pagrindinės modelio galimybės yra šios:

Natūralios kalbos apdorojimas tokioms užduotims kaip vertimas, apibendrinimas ir dialogas
Matematinis mąstymas ir problemų sprendimas
Gebėjimas generuoti kodą ir dokumentaciją
Vaizdų, garso ir vaizdo supratimas
Daugiafunkcinis darbas įvairiose srityse

Kaip matote, galimybės yra pranašesnės už kitus modelius.

Kalbos supratimo, matematinio mąstymo ir kodavimo testuose „Gemini Ultra“ pranoko tokius modelius kaip GPT-4. Visų pirma, tai yra pirmasis modelis, pranokstantis žmogaus lygio našumą atliekant Massive Multitask Language Understanding (MMLU) testą ir pasiekiantis daugiau nei 90 % tikslumą.

32 akademiniuose didelio kalbos modelio tyrimo testuose Dvyniai pranoko GPT-4. 30 atvejų naujasis „Google“ kalbos modelis buvo geresnis už konkurentą. Tai parodo modelio gebėjimą visiškai suprasti kalbą.

Taip pat skaitykite: Žmogaus smegenų projektas: bandymas imituoti žmogaus smegenis

Ar yra skirtingų versijų?

„Google“ apibūdina šį AI kaip lankstų modelį, kuris gali veikti bet kuriame įrenginyje: nuo „Google“ duomenų centrų iki mobiliųjų įrenginių. Norint pasiekti šį mastelį, „Gemini“ yra trijų versijų: „Nano“, „Pro“ ir „Ultra“.

Pakalbėkime apie skirtingas Dvynių versijas išsamiau.

Dvyniai Nano: skirtas dirbti išmaniuosiuose telefonuose, ypač Google Pixel 8. Jis skirtas atlikti užduotis, kurias reikia efektyviai apdoroti dirbtiniu intelektu, neprisijungus prie išorinių serverių, pavyzdžiui, siūlyti atsakymus pokalbių programose arba apibendrinti tekstą. Šis kompaktiškas įrenginio modelis turi apie 6 milijardus parametrų.
„Gemini Pro“: veikia Google duomenų centruose. „Pro“ sukurta dirbti su naujausia „Bard AI“ pokalbių roboto versija. Jis gali užtikrinti greitą atsakymo laiką ir suprasti sudėtingas užklausas. Vidutinio dydžio modelis turi maždaug 100 milijardų parametrų ir yra Bardo pokalbio AI pagrindas. „Pro“ bus pasiekiama per „Google Cloud“.
Dvyniai Ultra: nors „Ultra“ versija dar nėra plačiai prieinama, „Google“ apibūdina ją kaip geriausiai veikiantį modelį, viršijantį „dabartinį naujausią lygį 30 iš 32 plačiai naudojamų akademinių testų, naudojamų atliekant didelių kalbos modelių (LLM) tyrimus. “ Kaip didžiausia ir galingiausia versija, Ultra gaus daugiau nei 1 trilijoną parametrų. Jis bus įsikūręs duomenų centruose. Ultra yra pritaikytas naudojimui įmonėje. Versija sukurta labai sudėtingoms užduotims atlikti. „Google“ planuoja jį išleisti pasibaigus dabartiniam testavimo etapui. Tai yra, galingiausia versija vartotojams dar nepasiekiama.

Taip pat įdomu: „Google Bard AI“: viskas, ką reikia žinoti

- Reklama -

Kaip pasiekti Dvynius?

AI „Nano“ ir „Pro“ versijos dabar pasiekiamos „Google“ produktuose, pvz., „Google Pixel 8“ išmaniuosiuose telefonuose ir „Bard“ pokalbių robote. „Google“ planuoja galiausiai integruoti jį į savo paieškos sistemą, reklamą, „Gmail“ el. pašto paslaugą, „Chrome“ naršyklę ir kitas paslaugas.

Nuo 13 m. gruodžio 2023 d. kūrėjai ir verslo klientai galės pasiekti „Pro“ naudodami „Gemini“ API „Google AI Studio“ ir „Google Cloud Vertex AI“. Kūrėjai Android turės prieigą prie Nano versijos modelio per AICore, kuris bus pasiekiamas ankstyvoje peržiūroje.

Taip pat skaitykite: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: dviejų jokozunų mūšis

Dvyniai „Google Bard“: kas pasikeis?

Remiantis pristatymo metu pateikta informacija, modelis leis „Google Bard“ geriau spręsti sudėtingesnes problemas, kaip teigiama:

„Mes sukūrėme Dvynius taip, kad modelis būtų natūraliai daugiarūšis ir nuo pat pradžių buvo apmokytas įvairiais būdais. Tada mes jį patobulinome pridėdami daugiau daugiarūšių duomenų, kad pagerintume našumą. Dėl to Dvyniai lengvai supranta ir daro išvadas daug geriau nei ankstesni multimodaliniai modeliai ir gali pasigirti pažangiausiomis galimybėmis beveik visose srityse.

Nepaprastos „Gemini“ daugiarūšės galimybės padeda suprasti sudėtingą tekstinę ir vaizdinę informaciją. Jie ypač naudingi, kai reikia išgauti konkrečią informaciją iš didžiulių duomenų rinkinių. Nepaprastas šio modelio gebėjimas išgauti informacijos esmę iš šimtų tūkstančių dokumentų juos skaitant, filtruojant ir analizuojant neabejotinai prisidės prie naujų, žaibiškų atradimų įvairiose srityse nuo mokslo iki finansų.“

Pristatymo metu buvo pademonstruotas kompleksinio tyrimo pavyzdys, kuriame yra daugiau nei 200 tūkstančių įrašų, kurių dalį teko atnaujinti pagal naujus duomenis. Kaip jau galėjote atspėti, tai padaryti rankiniu būdu užtruktų labai daug laiko, todėl tyrimo autoriai naudojo Gemini, kad paruoštų kodą, kuris paėmė įvestį ir atliko reikiamus atnaujinimus. Kitas, labiau realus pavyzdys – „Google“ kalbos modelio naudojimas matematikos ar fizikos problemoms paaiškinti.

Įvesties duomenys čia buvo užduoties iš mokyklos pamokos nuotrauka / nuskaitymas. Sistema sugebėjo apdoroti ten saugomą grafiką ir tekstą ir tada nurodyti, kurios namų darbų dalys buvo atliktos teisingai, o kurioms reikia skirti daugiau dėmesio. Pristatymas parodė, kad vartotojas gali ne kartą prašyti Dvynių paaiškinti užduotį, o kiekvienas tolesnis bandymas turi būti paaiškintas paprastesne kalba. Kiek tikslūs ir teisingi bus Dvyniai, žinoma, patikrins besidomintys, tačiau galimybė skaityti ir apdoroti tekstą tiesiai iš nuotraukų – įspūdinga. Pristatymo metu pridėta:

"Dvyniai buvo mokomi vienu metu atpažinti ir suprasti tekstą, vaizdus, garsus ir kt. Dėl to jis geriau supranta informacijos niuansus ir gali atsakyti į sudėtingus klausimus. Jis ypač efektyvus aiškinantis su matematika ir fizika susijusias temas, todėl gali būti asmeninis namų darbų pagalbininkas.".

Dvyniai „Google Pixel“ išmaniuosiuose telefonuose

„Google“ taip pat gyrėsi, kad „Gemini“ „pasimokė“ apie naujus TPUv5 mikroschemų rinkinius ir planuoja 2024 m. pradžioje pristatyti „Gemini Ultra“, kurioje bus naudojama „Bard Advanced“ – nauja milžino kalbos modelio vartotojams skirtos versijos versija. „Gemini Ultra“ šiuo metu yra testuojamas ir jau prieinamas atrinktiems saugumo ekspertams.

Paskutinė svarbi informacija yra „Gemini“ pristatymas „Google Pixel 8“ išmaniuosiuose telefonuose. Tai leis, be kita ko, sukurti greitus atsakymus per „Gboard“ programą messengeriuose. Pirmoji – „WhatsApp“, tačiau kitais metais tokie sprendimai atsiras ir kitose su komunikacija susijusiose programose. Tačiau tai tik pradžia, nes „Google“ paskelbė daug naujų AI įrankių, skirtų „Pixel 8“ išmaniesiems telefonams, o ateityje jie bus pasiekiami ir kai kuriuose kituose įrenginiuose. Android. Tačiau tai yra tolimesni planai ir kol kas daugiau informacijos nepateikiama.

Kuo Dvyniai skiriasi nuo kitų AI modelių, tokių kaip GPT-4?

Naujasis „Google“ modelis Gemini atrodo vienas didžiausių ir pažangiausių dirbtinio intelekto modelių iki šiol, nors Ultra modelio išleidimas tai tikrai lems. Palyginti su kitais populiariais modeliais, šiuo metu naudojančiais AI pokalbių robotus, „Gemini“ išsiskiria savo multimodaline funkcija, o kiti modeliai, tokie kaip GPT-4, remiasi papildiniais ir integracija, kad būtų tikrai daugiarūšiai.

Susirūpinimas dėl tikslumo ir nešališkumo

Nors Dvyniai yra didelis šuolis į priekį plėtojant dirbtinio intelekto galimybes, jis turi tuos pačius trūkumus kaip ir kiti pagrindiniai kalbos modeliai. Visų pirma, tai galimybė sukurti klaidingą informaciją. Šališkumas taip pat grindžiamas mokymo duomenimis, prieinamais naujajam kalbos modeliui. Taip pat verta paminėti ribotą realaus pasaulio supratimą. „Google“ pripažįsta, kad naujasis „Gemini“ modelis gali klysti, pateikti faktus, kurie nėra pagrįsti įrodymais ir prieštarauja sveikam protui.

Reikia daugiau bandymų, ypač „Gemini Ultra“, kuri turi naujų galimybių, kurios dar nėra iki galo ištirtos. „Google“ yra įsipareigojusi atidžiai įvertinti Dvynius, kad sumažintų galimą žalą.

Taip pat įdomu: Viskas apie Microsoft Antrasis pilotas: ateitis ar neteisingas kelias?

Ateitis – su Dvyniais

„Google“ išleidusi „Gemini“ pradėjo naują AI kūrimo erą. Palyginti su ankstesniais modeliais ir žmogaus pradiniais modeliais, Dvyniai atkreipia dėmesį į būsimas dirbtinio intelekto galimybes, tačiau vis dar reikia daugiau tyrimų, kad būtų pašalinti tam tikri trūkumai.

Ateityje galite tikėtis, kad „Gemini“ pateiks daugiau naudingų ir išmanesnių „Google“ produktų funkcijų. Ateityje bendrovė planuoja toliau plėsti Gemini ne tik anglų kalba, bet ir remtis savo pagrindine modelio metodika.

Galime tik stebėti ir tikėtis, kad „Google“ žino, ką daro.

Taip pat skaitykite:

Daugiau iš autoriaus

Registruotis

0 komentarai

Įterptieji atsiliepimai

Žiūrėti visus komentarus

Kiti straipsniai

Kas yra Dvyniai: viskas apie naująjį „Google“ AI modelį