Root NationArtikkelitTeknologiatMikä on Gemini: Kaikki Googlen uudesta AI-mallista

Mikä on Gemini: Kaikki Googlen uudesta AI-mallista

-

Google on juuri julkaissut kaikkien aikojen tehokkaimman tekoälymallinsa Kaksoset. Mikä hän on ja mitä hän voi tehdä? Tietoja kaikesta artikkelissamme.

Google on kehittänyt omia tekoälytyökalujaan vuosia. OpenAI:n ChatGPT-3:n julkisen julkaisun myötä maailman suosituinta hakukonetta ylläpitävä yritys on myös luonut vastaavan työkalun, Bardin. Mutta tämä työkalu hävisi edelleen kilpailijoille, mitä Google ei voinut sallia. Siksi ei ole yllättävää, että maailma näki äskettäin Gemini, Googlen uuden kielimallin, josta saimme tietää esityksen aikana.

Se ei ole suunniteltu ainoastaan ​​parantamaan jättiläisen aiempaa LLM:ää (Large Language Model), vaan myös tarjoamaan täysin uusia mahdollisuuksia tekstinkäsittelyn, grafiikan ja äänen alalla.

Tarkastellaanpa siis tarkemmin uutta Google Gemini -kielimallia.

Mielenkiintoista myös: OpenAI Project Q*: mikä se on ja miksi projekti on huolenaihe

Mikä on Google Gemini?

Tämä on Googlen uusi ja tehokas tekoälyn malli, joka ymmärtää tekstin lisäksi myös kuvia, videoita ja ääntä. Tämän multimodaalisen mallin kuvataan pystyvän suorittamaan monimutkaisia ​​tehtäviä matematiikassa, fysiikassa ja muilla aloilla sekä ymmärtämään ja luomaan korkealaatuista koodia useilla ohjelmointikielillä.

Google Gemini

Gemini on tällä hetkellä saatavilla integroituna Google Bardin ja Google Pixel 8:n kanssa, ja se sisällytetään vähitellen muihin Googlen palveluihin.

"Gemini on tulosta Googlen tiimien, mukaan lukien Google Researchin kollegojemme välisestä massiivisesta yhteistyöstä." sanoi Dennis Hassabis, Google DeepMindin toimitusjohtaja ja toinen perustaja. "Se rakennettiin alusta alkaen multimodaaliksi, mikä tarkoittaa, että se voi yleistää ja saumattomasti ymmärtää, käyttää ja yhdistää erityyppisiä tietoja, mukaan lukien tekstiä, koodia, ääntä, kuvia ja videoita."

- Mainos -

Mielenkiintoista myös: Kaikki mitä kutsumme tekoälyksi, ei todellakaan ole tekoälyä. Tässä on mitä sinun on tiedettävä

Kuka loi mallin?

Google Gemini

Kuten olet todennäköisesti jo arvannut, Geminin ovat luoneet Google ja Alphabet, Googlen emoyhtiö, ja se on yhtiön edistynein tekoälymalli tähän mennessä. Myös Googlen DeepMind-divisioona osallistui merkittävästi sen kehittämiseen. Vielä ei tiedetä, kuinka monta työntekijää kehitystyöhön osallistui ja mitä varoja tähän on osoitettu, mutta Googlen kyvyt tuntemalla voimme olla varmoja, että määrä on erittäin suuri.

Mielenkiintoista myös: Windows 12: Mikä on uusi käyttöjärjestelmä

Mahdollisuudet

Kuten edellä totesin, se on multimodaalinen malli, mikä tarkoittaa, että se voi ymmärtää, käyttää ja yhdistää erityyppisiä tietoja, mukaan lukien tekstiä, koodia, ääntä, kuvia ja videoita. Se tarjoaa paremmat ymmärrys-, ajattelu- ja koodaustaidot verrattuna aikaisempiin tekoälyjärjestelmiin.

Google Gemini

Mallin tärkeimmät ominaisuudet ovat:

  • Luonnollisen kielen käsittely tehtäviin, kuten käännös, yhteenveto ja dialogi
  • Matemaattinen ajattelu ja ongelmanratkaisu
  • Kyky luoda koodia ja dokumentaatiota
  • Kuvien, äänen ja videon ymmärtäminen
  • Moniajo eri aloilla

Kuten näet, ominaisuudet ovat muita malleja parempia.

Kielen ymmärtämisen, matemaattisen ajattelun ja koodauksen testeissä Gemini Ultra menestyi paremmin kuin mallit, kuten GPT-4. Erityisesti se on ensimmäinen malli, joka ylittää ihmistason suorituskyvyn Massive Multitask Language Understanding (MMLU) -testissä saavuttaen yli 90 prosentin tarkkuuden.

Suuren kielimallitutkimuksen 32 akateemisessa testissä Gemini suoriutui paremmin kuin GPT-4. 30 tapauksessa Googlen uusi kielimalli oli kilpailijaa parempi. Tämä osoittaa mallin kyvyn ymmärtää kieltä täysin.

Lue myös: Human Brain Project: Yritys jäljitellä ihmisaivoja

Onko olemassa erilaisia ​​versioita?

Google kuvailee tätä tekoälyä joustavaksi malliksi, joka toimii kaikilla laitteilla: Googlen palvelinkeskuksista mobiililaitteisiin. Tämän skaalautuvuuden saavuttamiseksi Geministä on kolme versiota: Nano, Pro ja Ultra.

Google Gemini

Puhutaanpa tarkemmin Geminin eri versioista.

  • Gemini Nano: suunniteltu toimimaan älypuhelimissa, erityisesti Google Pixel 8:ssa. Se on suunniteltu suorittamaan tehtäviä, jotka vaativat tehokasta tekoälyn käsittelyä ilman yhteyttä ulkoisiin palvelimiin, kuten vastausten ehdottaminen chat-ohjelmissa tai tekstin yhteenveto. Tässä kompaktissa laitemallissa on noin 6 miljardia parametria.
  • GeminiPro: toimii Googlen palvelinkeskuksissa. Pro on suunniteltu toimimaan Bard AI -chatbotin uusimman version kanssa. Se pystyy tarjoamaan nopeat vastausajat ja ymmärtämään monimutkaisia ​​kyselyitä. Keskikokoisella mallilla on noin 100 miljardia parametria ja se on Bardin keskustelun tekoälyn ydin. Pro on saatavilla Google Cloudin kautta.
  • Gemini Ultra: vaikka Ultra-versio ei ole vielä laajalti saatavilla, Google kuvailee sitä parhaiten suoriutuvaksi mallikseen, joka ylittää "nykyisen tekniikan tason 30:ssa 32 laajasti käytetystä akateemisesta testistä, joita käytetään suurten kielimallien (LLM) tutkimuksessa. " Suurimpana ja tehokkaimpana versiona Ultra saa yli 1 biljoonaa parametria. Se tulee sijaitsemaan datakeskuksissa. Ultra on sovitettu yrityskäyttöön. Versio on suunniteltu suorittamaan erittäin monimutkaisia ​​​​tehtäviä. Google aikoo julkaista sen nykyisen testausvaiheen jälkeen. Eli tehokkain versio ei ole vielä käyttäjien saatavilla.

Mielenkiintoista myös: Google Bard AI: Kaikki mitä sinun tarvitsee tietää

- Mainos -

Kuinka päästä Geminiin?

Tekoäly Nano- ja Pro-versiot ovat nyt saatavilla Googlen tuotteissa, kuten Google Pixel 8 -älypuhelimissa ja Bard chatbotissa. Google aikoo lopulta integroida sen hakukoneeseensa, mainontaan, Gmail-sähköpostipalveluun, Chrome-selaimeen ja muihin palveluihin.

Kehittäjät ja yritysasiakkaat voivat käyttää Prota Gemini APIn kautta Google AI Studiossa ja Google Cloud Vertex AI:ssä 13. joulukuuta 2023 alkaen. Kehittäjät Android saa pääsyn Nano-versiomalliin AICoren kautta, joka on saatavilla varhaisessa esikatselussa.

Lue myös: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Kahden yokozunin taistelu

Gemini Google Bardissa: Mikä muuttuu?

Esityksen aikana annettujen tietojen mukaan mallin avulla Google Bard pystyy käsittelemään paremmin monimutkaisempia ongelmia, kuten todettiin:

"Suunnittelimme Geminin niin, että malli on luonnollisesti multimodaalinen ja valmiiksi koulutettu useisiin modaliteeteihin alusta alkaen. Tarkensimme sitä lisäämällä multimodaalista dataa suorituskyvyn parantamiseksi. Tämän seurauksena Gemini ymmärtää ja päättelee helposti paljon paremmin kuin aiemmat multimodaaliset mallit, ja sillä on huippuluokan ominaisuudet lähes kaikilla alueilla.

Geminin poikkeukselliset multimodaaliset ominaisuudet auttavat sinua ymmärtämään monimutkaista tekstiä ja visuaalista tietoa. Ne ovat erityisen hyödyllisiä, kun halutaan poimia tiettyjä tietoja valtavista tietojoukoista. Tämän mallin poikkeuksellinen kyky poimia tiedon ydin sadoista tuhansista asiakirjoista lukemalla, suodattamalla ja analysoimalla niitä epäilemättä edistää uusien, salamannopeiden löytöjen tekemiseen eri aloilla tieteestä rahoitukseen."

Esityksen aikana esiteltiin esimerkki monimutkaisesta tutkimuksesta, joka sisältää yli 200 tuhatta tietuetta, joista osa jouduttiin päivittämään uusien tietojen mukaan. Kuten saatat arvata, tämän tekeminen manuaalisesti olisi erittäin aikaa vievää, joten tutkimuksen tekijät valmistivat Geminiä koodin, joka otti syötteen ja teki tarvittavat päivitykset. Toinen, todellisempi esimerkki on Googlen kielimallin käyttäminen matematiikan tai fysiikan ongelmien selittämiseen.

Google Gemini

Syöttötiedot tässä olivat valokuva/skannaus koulun oppitunnin tehtävästä. Järjestelmä pystyi käsittelemään sinne tallennetun grafiikan ja tekstin ja sitten osoittamaan, mitkä kotitehtävistä tehtiin oikein ja mitkä vaativat enemmän huomiota. Esitys osoitti, että käyttäjä voi toistuvasti pyytää Geminiä selittämään tehtävän, ja jokainen seuraava yritys on selitettävä yksinkertaisemmalla kielellä. Kiinnostuneet tarkistavat tietysti, kuinka tarkka ja oikea Gemini on, mutta kyky lukea ja käsitellä tekstiä suoraan valokuvista on vaikuttava. Kuten esityksen aikana lisätty:

"Kaksoset on opetettu tunnistamaan ja ymmärtämään tekstiä, kuvia, ääniä ja paljon muuta samanaikaisesti. Tämän ansiosta hän ymmärtää paremmin tiedon vivahteita ja osaa vastata monimutkaisiin kysymyksiin. Se on erityisen tehokas matematiikkaan ja fysiikkaan liittyvien aiheiden selittämiseen, joten se voi toimia henkilökohtaisena kotitehtävien apulaisena".

Gemini Google Pixel -älypuhelimissa

Google kehui myös, että Gemini "oppii" uusista TPUv5-piirisarjoista, ja aikoo esitellä vuoden 2024 alussa Gemini Ultran, joka käyttää Bard Advancedia, uutta versiota jättiläisen puhemallin kuluttajaversiosta. Gemini Ultra on parhaillaan testauksessa, ja se on jo valittujen tietoturvaasiantuntijoiden saatavilla.

Google Gemini

Viimeinen tärkeä tieto on Geminin esittely Google Pixel 8 -älypuhelimissa, mikä mahdollistaa muun muassa nopean vastauksen luomisen Gboard-sovelluksen kautta messengerissä. Ensimmäinen on WhatsApp, mutta ensi vuonna tällaisia ​​ratkaisuja ilmestyy muihin viestintään liittyviin sovelluksiin. Tämä on kuitenkin vasta alkua, sillä Google on julkistanut monia uusia tekoälytyökaluja Pixel 8 -älypuhelimille, ja ne tulevat saataville myös joihinkin muihin laitteisiin tulevaisuudessa. Android. Nämä ovat kuitenkin lisäsuunnitelmia, eikä niistä ole toistaiseksi kerrottu yksityiskohtia.

Miten Gemini eroaa muista tekoälymalleista, kuten GPT-4?

Googlen uusi Gemini-malli näyttää olevan yksi suurimmista ja edistyneimmistä tekoälymalleista tähän mennessä, vaikka Ultra-mallin julkaisu ratkaisee tämän varmasti. Verrattuna muihin suosittuihin malleihin, jotka käyttävät tällä hetkellä AI-chatbotteja, Gemini erottuu omalla multimodaalisella ominaisuudellaan, kun taas muut mallit, kuten GPT-4, luottavat laajennuksiin ja integraatioon ollakseen todella multimodaalisia.

Huoli tarkkuudesta ja puolueettomuudesta

Vaikka Gemini on suuri harppaus tekoälykapasiteetin kehittämisessä, sillä on samat puutteet kuin muissa suurissa kielimalleissa. Ensinnäkin tämä on mahdollisuus luoda vääriä tietoja. Harhat perustuvat myös uuden kielimallin käytettävissä oleviin harjoitustietoihin. On myös syytä mainita rajallinen ymmärrys todellisesta maailmasta. Google myöntää, että uusi Gemini-malli voi tehdä virheitä, tarjota faktoja, jotka eivät perustu todisteisiin ja ovat ristiriidassa terveen järjen kanssa.

Google Gemini

Lisää testejä tarvitaan erityisesti Gemini Ultralle, jolla on uusia ominaisuuksia, joita ei ole vielä täysin tutkittu. Google on sitoutunut arvioimaan Geminit huolellisesti mahdollisten haittojen minimoimiseksi.

Mielenkiintoista myös: Kaikki Microsoft Ohjaaja: tulevaisuus vai väärä tapa?

Tulevaisuus on Kaksosissa

Googlen Geminin lanseeraus aloitti tekoälykehityksen uuden aikakauden. Parhaalla suorituskyvyllään verrattuna aikaisempiin malleihin ja ihmisen lähtötilanteisiin Gemini viittaa tekoälyn tulevaisuuden mahdollisuuksiin, mutta tarvitsee silti lisää tutkimusta tiettyjen puutteiden korjaamiseksi.

Jatkossa voit odottaa Geminin tarjoavan hyödyllisempiä ja älykkäämpiä ominaisuuksia Googlen tuotteissa. Jatkossa yritys aikoo jatkaa Geminin laajentamista englannin kielen ulkopuolelle ja rakentaa ydinmallimenetelmäänsä.

Voimme vain katsella ja toivoa, että Google tietää, mitä se tekee.

Lue myös: 

Yuri Svitlyk
Yuri Svitlyk
Karpaattien poika, tuntematon matematiikan nero, "lakimies"Microsoft, käytännöllinen altruisti, vasen-oikea
- Mainos -
Kirjaudu
Ilmoita asiasta
vieras

0 Kommentit
Upotetut arvostelut
Näytä kaikki kommentit