Wat is Gemini: alles over het nieuwe AI-model van Google

Google heeft zojuist zijn krachtigste AI-model ooit uitgebracht Gemini. Wat is zij en wat kan zij doen? Over alles in ons artikel.

Google ontwikkelt al jaren zijn eigen AI-tools. Met de publieke release van ChatGPT-3 van OpenAI heeft het bedrijf dat de populairste zoekmachine ter wereld beheert ook een soortgelijke tool gemaakt, Bard. Maar deze tool verloor nog steeds van concurrenten, wat Google niet kon toestaan. Het is daarom niet verrassend dat de wereld onlangs Gemini zag, een nieuw taalmodel van Google, waarover we tijdens de presentatie leerden.

Het is niet alleen ontworpen om het eerdere LLM (Large Language Model) van de gigant te verbeteren, maar ook om compleet nieuwe mogelijkheden te bieden op het gebied van tekstverwerking, grafische weergave en geluid.

Laten we het nieuwe Google Gemini-taalmodel eens nader bekijken.

Ook interessant: OpenAI Project Q*: wat het is en waarom het project zorgwekkend is

INHOUD

1. Wat is Google Gemini?

2. Wie heeft het model gemaakt?

3. Mogelijkheden

4. Zijn er verschillende versies?

5. Hoe krijg ik toegang tot Tweelingen?

6. Gemini bij Google Bard: wat gaat er veranderen?

7. Gemini in Google Pixel-smartphones

8. Waarin verschilt Gemini van andere AI-modellen, zoals GPT-4?

9. Zorgen over nauwkeurigheid en onpartijdigheid

10. De toekomst ligt bij Gemini

Wat is Google Gemini?

Dit is een nieuw en krachtig model van kunstmatige intelligentie van Google, dat niet alleen tekst, maar ook afbeeldingen, video's en audio kan begrijpen. Er wordt beschreven dat dit multimodale model complexe taken op het gebied van wiskunde, natuurkunde en andere domeinen kan uitvoeren, en hoogwaardige code in een verscheidenheid aan programmeertalen kan begrijpen en genereren.

Gemini is momenteel beschikbaar via integratie met Google Bard en Google Pixel 8 en zal geleidelijk worden opgenomen in andere Google-diensten.

"Gemini is het resultaat van een enorme samenwerking tussen Google-teams, inclusief onze collega's bij Google Research", — zegt Dennis Hassabis, CEO en mede-oprichter van Google DeepMind. "Het is vanaf de basis opgebouwd om multimodaal te zijn, wat betekent dat het verschillende soorten informatie, waaronder tekst, code, audio, afbeeldingen en video, kan generaliseren en naadloos kan begrijpen, ermee kan werken en deze kan combineren."

- Advertentie -

Ook interessant: Niet alles wat we AI noemen, is eigenlijk kunstmatige intelligentie. Dit is wat u moet weten

Wie heeft het model gemaakt?

Zoals je waarschijnlijk al geraden hebt, is Gemini gemaakt door Google en Alphabet, het moederbedrijf van Google, en is het het meest geavanceerde AI-model van het bedrijf tot nu toe. De DeepMind-divisie van Google heeft ook een belangrijke bijdrage geleverd aan de ontwikkeling ervan. Het is nog niet bekend hoeveel medewerkers aan de ontwikkeling hebben deelgenomen en welke middelen hiervoor zijn uitgetrokken, maar als we de mogelijkheden van Google kennen, kunnen we er zeker van zijn dat het om een zeer groot bedrag gaat.

Ook interessant: Windows 12: wat wordt het nieuwe besturingssysteem

Mogelijkheden

Zoals ik hierboven heb opgemerkt, is het een multimodaal model, wat betekent dat het verschillende soorten gegevens kan begrijpen, bewerken en combineren, waaronder tekst, code, audio, afbeeldingen en video. Het biedt betere begrips-, denk- en codeervaardigheden in vergelijking met eerdere AI-systemen.

De belangrijkste mogelijkheden van het model zijn:

Natuurlijke taalverwerking voor taken zoals vertalen, samenvatten en dialoog
Wiskundig denken en probleemoplossing
Mogelijkheid om code en documentatie te genereren
Begrijpen van afbeeldingen, audio en video
Multitasken in verschillende domeinen

Zoals u kunt zien, zijn de mogelijkheden superieur aan die van andere modellen.

Bij tests op het gebied van taalbegrip, wiskundig denken en coderen presteerde de Gemini Ultra beter dan modellen zoals de GPT-4. Het is met name het eerste model dat de prestaties op menselijk niveau overtreft op de Massive Multitask Language Understanding (MMLU)-test, met een nauwkeurigheid van meer dan 90%.

In 32 academische tests van een groot taalmodelonderzoek presteerde Gemini beter dan GPT-4. In 30 gevallen was het nieuwe taalmodel van Google beter dan de concurrent. Dit toont aan dat het model de taal volledig kan begrijpen.

Lees ook: Human Brain Project: een poging om het menselijk brein te imiteren

Zijn er verschillende versies?

Google omschrijft deze AI als een flexibel model dat op elk apparaat kan werken: van Google-datacenters tot mobiele apparaten. Om deze schaalbaarheid te bereiken, komt Gemini in drie versies: Nano, Pro en Ultra.

Laten we de verschillende versies van Gemini in meer detail bespreken.

Tweeling Nano: ontworpen om te werken op smartphones, in het bijzonder de Google Pixel 8. Het is ontworpen om taken uit te voeren die een efficiënte verwerking door kunstmatige intelligentie vereisen zonder verbinding te maken met externe servers, zoals het voorstellen van antwoorden in chatprogramma's of het samenvatten van tekst. Dit compacte apparaatmodel heeft ongeveer 6 miljard parameters.
Gemini Pro: draait in datacentra van Google. Pro is ontworpen om te werken met de nieuwste versie van de Bard AI-chatbot. Het is in staat om snelle responstijden te bieden en complexe vragen te begrijpen. Een middelgroot model heeft ongeveer 100 miljard parameters en vormt de kern van Bard's conversationele AI. Pro zal beschikbaar zijn via Google Cloud.
Tweeling Ultra: hoewel de Ultra-versie nog niet algemeen beschikbaar is, beschrijft Google deze als het best presterende model, dat "de huidige stand van zaken overtreft voor 30 van de 32 veelgebruikte academische tests die worden gebruikt in onderzoek naar grote taalmodellen (LLM). " Als de grootste en krachtigste versie zal Ultra meer dan 1 biljoen parameters ontvangen. Het zal in datacenters worden geplaatst. Ultra is aangepast voor zakelijk gebruik. De versie is ontworpen om zeer complexe taken uit te voeren. Google is van plan het uit te brengen na het einde van de huidige testfase. Dat wil zeggen dat de krachtigste versie nog niet beschikbaar is voor gebruikers.

Ook interessant: Google Bard AI: alles wat u moet weten

- Advertentie -

Hoe krijg ik toegang tot Tweelingen?

AI in Nano- en Pro-versies zijn nu beschikbaar in Google-producten zoals respectievelijk de Google Pixel 8-smartphones en de Bard-chatbot. Google is van plan om het uiteindelijk te integreren in zijn zoekmachine, advertenties, Gmail-e-mailservice, Chrome-browser en andere services.

Ontwikkelaars en zakelijke klanten hebben vanaf 13 december 2023 toegang tot Pro via de Gemini API in Google AI Studio en Google Cloud Vertex AI. Ontwikkelaars Android krijgt toegang tot het Nano-versiemodel via AICore, dat beschikbaar zal zijn in een vroege preview.

Lees ook: Samsung Galaxy Flip5 versus Motorola Razr 40 Ultra: Slag om de twee Yokozuns

Gemini bij Google Bard: wat gaat er veranderen?

Volgens de informatie die tijdens de presentatie werd verstrekt, zal het model Google Bard in staat stellen om complexere problemen beter aan te kunnen, zoals vermeld:

“We hebben Gemini zo ontworpen dat het model van nature multimodaal is en vanaf het begin vooraf getraind is in meerdere modaliteiten. Vervolgens hebben we het verfijnd door meer multimodale gegevens toe te voegen om de prestaties te verbeteren. Als resultaat hiervan begrijpt en concludeert Gemini veel beter dan eerdere multimodale modellen, en beschikt het over de modernste mogelijkheden op bijna alle gebieden.

De buitengewone multimodale mogelijkheden van Gemini helpen u complexe tekst- en visuele informatie te begrijpen. Ze zijn vooral handig als het gaat om het extraheren van specifieke informatie uit enorme datasets. Het buitengewone vermogen van dit model om de essentie van informatie uit honderdduizenden documenten te halen door ze te lezen, filteren en analyseren zal ongetwijfeld bijdragen aan nieuwe, bliksemsnelle ontdekkingen op verschillende gebieden, van wetenschap tot financiën.

Tijdens de presentatie werd een voorbeeld van een complex onderzoek gedemonstreerd, dat meer dan 200 records bevat, waarvan sommige moesten worden bijgewerkt op basis van nieuwe gegevens. Zoals je misschien al geraden had, zou het erg tijdrovend zijn om dit handmatig te doen, dus gebruikten de auteurs van het onderzoek Gemini om code voor te bereiden die de invoer opnam en de nodige updates doorvoerde. Een ander, realistischer voorbeeld is het gebruik van het taalmodel van Google om wiskundige of natuurkundige problemen uit te leggen.

De invoergegevens hier waren een foto/scan van een opdracht uit een schoolles. Het systeem kon de daar opgeslagen afbeeldingen en tekst verwerken en vervolgens aangeven welke delen van het huiswerk goed waren gedaan en welke meer aandacht nodig hadden. Uit de presentatie bleek dat een gebruiker Gemini herhaaldelijk kan vragen een taak uit te leggen, en dat elke volgende poging in eenvoudiger taal moet worden uitgelegd. Hoe nauwkeurig en correct Gemini zal zijn, zal natuurlijk door geïnteresseerden worden gecontroleerd, maar het vermogen om tekst rechtstreeks van foto's te lezen en te verwerken is indrukwekkend. Zoals toegevoegd tijdens de presentatie:

"Gemini heeft geleerd tekst, afbeeldingen, geluiden en meer tegelijkertijd te herkennen en te begrijpen. Hierdoor begrijpt hij de nuances van informatie beter en kan hij complexe vragen beantwoorden. Het is bijzonder effectief bij het uitleggen van onderwerpen die verband houden met wiskunde en natuurkunde, zodat het kan dienen als een persoonlijke huiswerkhulp'.

Gemini in Google Pixel-smartphones

Google pochte ook dat Gemini de nieuwe TPUv5-chipsets had "geleerd" en is van plan om begin 2024 Gemini Ultra te introduceren, die Bard Advanced zal gebruiken, een nieuwe versie van de consumentenversie van het spraakmodel van de gigant. Gemini Ultra wordt momenteel getest en is al beschikbaar voor geselecteerde beveiligingsexperts.

Het laatste belangrijke stukje informatie is de introductie van Gemini in de smartphones Google Pixel 8. Hiermee kunnen onder meer snelle antwoorden worden gecreëerd via de Gboard-applicatie in messengers. De eerste is WhatsApp, maar volgend jaar zullen dergelijke oplossingen verschijnen in andere applicaties die verband houden met communicatie. Dit is echter nog maar het begin, aangezien Google veel nieuwe AI-tools voor de Pixel 8-smartphones heeft aangekondigd, en deze in de toekomst op sommige andere apparaten beschikbaar zullen zijn. Android. Dit zijn echter verdere plannen en er zijn op dit moment geen details verstrekt.

Waarin verschilt Gemini van andere AI-modellen, zoals GPT-4?

Het nieuwe Gemini-model van Google lijkt een van de grootste en meest geavanceerde AI-modellen tot nu toe, hoewel de release van het Ultra-model dat zeker zal bepalen. Vergeleken met andere populaire modellen die momenteel AI-chatbots gebruiken, valt Gemini op door zijn eigen multimodale functie, terwijl andere modellen zoals GPT-4 afhankelijk zijn van plug-ins en integratie om echt multimodaal te zijn.

Zorgen over nauwkeurigheid en onpartijdigheid

Hoewel Gemini een grote sprong voorwaarts is in de ontwikkeling van mogelijkheden voor kunstmatige intelligentie, kent het dezelfde tekortkomingen als andere grote taalmodellen. Allereerst is dit de mogelijkheid om valse informatie te creëren. Vooroordelen zijn ook gebaseerd op de trainingsgegevens die beschikbaar zijn voor het nieuwe taalmodel. Het is ook de moeite waard om het beperkte begrip van de echte wereld te vermelden. Google geeft toe dat het nieuwe Gemini-model fouten kan maken, feiten kan aandragen die niet op bewijs zijn gebaseerd en in tegenspraak is met het gezond verstand.

Er zijn meer tests nodig, vooral voor Gemini Ultra, dat nieuwe mogelijkheden heeft die nog niet volledig zijn onderzocht. Google doet er alles aan om Gemini zorgvuldig te evalueren om mogelijke schade tot een minimum te beperken.

Ook interessant: Alles over Microsoft Copiloot: de toekomst of de verkeerde kant op?

De toekomst ligt bij Gemini

De lancering van Gemini door Google luidde een nieuw tijdperk van AI-ontwikkeling in. Met zijn beste prestaties vergeleken met eerdere modellen en menselijke basislijnen wijst Gemini op de toekomstige mogelijkheden van kunstmatige intelligentie, maar heeft nog steeds meer onderzoek nodig om bepaalde tekortkomingen aan te pakken.

In de toekomst kunt u van Gemini verwachten dat hij nuttigere en intelligentere functies in Google-producten zal bieden. In de toekomst is het bedrijf van plan Gemini verder uit te breiden dan het Engels en voort te bouwen op de kernmodelmethodologie.

We kunnen alleen maar toekijken en hopen dat Google weet wat het doet.

Lees ook:

Meer van de auteur

Aanmelden

0 Heb je vragen? Stel ze hier.

Ingesloten beoordelingen

Bekijk alle reacties

Andere artikelen