Root NationArticoliTecnologieCos'è Gemini: tutto sul nuovo modello di intelligenza artificiale di Google

Cos'è Gemini: tutto sul nuovo modello di intelligenza artificiale di Google

-

Google ha appena rilasciato il suo modello di intelligenza artificiale più potente mai chiamato Gemini. Cos'è e cosa può fare? Tutto nel nostro articolo.

Google sviluppa da anni i propri strumenti di intelligenza artificiale. Con il rilascio pubblico di ChatGPT-3 da OpenAI, la società che gestisce il motore di ricerca più famoso al mondo ha creato anche uno strumento simile, Bard. Ma questo strumento continuava a perdere terreno rispetto alla concorrenza, cosa che Google non poteva consentire. Non sorprende quindi che il mondo abbia recentemente visto Gemini, un nuovo modello linguistico di Google, di cui abbiamo appreso durante la presentazione.

È progettato non solo per migliorare il precedente LLM (Large Language Model) del colosso, ma anche per offrire possibilità completamente nuove nel campo dell'elaborazione del testo, della grafica e del suono.

Diamo quindi uno sguardo più da vicino al nuovo modello linguistico di Google Gemini.

Interessante anche: Progetto OpenAI Q*: cos'è e perché il progetto preoccupa

Cos'è Google Gemini?

Si tratta di un nuovo e potente modello di intelligenza artificiale di Google, in grado di comprendere non solo testo, ma anche immagini, video e audio. Questo modello multimodale è descritto come in grado di eseguire compiti complessi in matematica, fisica e altri settori, oltre a comprendere e generare codice di alta qualità in una varietà di linguaggi di programmazione.

Google Gemelli

Gemini è attualmente disponibile tramite l'integrazione con Google Bard e Google Pixel 8 e verrà gradualmente incluso negli altri servizi Google.

"Gemini è il risultato di un enorme sforzo di collaborazione tra i team di Google, compresi i nostri colleghi di Google Research," — ha affermato Dennis Hassabis, CEO e co-fondatore di Google DeepMind. "È stato costruito da zero per essere multimodale, il che significa che può generalizzare e comprendere, operare e combinare perfettamente diversi tipi di informazioni, inclusi testo, codice, audio, immagini e video."

- Annuncio pubblicitario -

Interessante anche: Non tutto ciò che chiamiamo AI è in realtà intelligenza artificiale. Ecco cosa devi sapere

Chi ha creato il modello?

Google Gemelli

Come probabilmente avrai già intuito, Gemini è stato creato da Google e Alphabet, la società madre di Google, ed è il modello di intelligenza artificiale più avanzato dell'azienda fino ad oggi. Anche la divisione DeepMind di Google ha dato un contributo significativo al suo sviluppo. Non è ancora noto quanti dipendenti abbiano partecipato allo sviluppo e quali fondi siano stati stanziati per questo, ma conoscendo le capacità di Google, possiamo essere sicuri che ce ne sia una quantità molto elevata.

Interessante anche: Windows 12: quale sarà il nuovo sistema operativo

Opportunità

Come ho notato sopra, è un modello multimodale, nel senso che può comprendere, operare e combinare diversi tipi di dati, inclusi testo, codice, audio, immagini e video. Fornisce migliori capacità di comprensione, pensiero e codifica rispetto ai precedenti sistemi di intelligenza artificiale.

Google Gemelli

Le principali funzionalità del modello sono:

  • Elaborazione del linguaggio naturale per attività quali traduzione, riepilogo e dialogo
  • Pensiero matematico e risoluzione di problemi
  • Capacità di generare codice e documentazione
  • Comprendere immagini, audio e video
  • Multitasking in diversi ambiti

Come puoi vedere, le capacità sono superiori ad altri modelli.

Nei test di comprensione del linguaggio, pensiero matematico e codifica, il Gemini Ultra ha sovraperformato modelli come il GPT-4. In particolare, è il primo modello a superare le prestazioni di livello umano nel test Massive Multitask Language Understanding (MMLU), raggiungendo una precisione superiore al 90%.

In 32 test accademici di un ampio studio sul modello linguistico, Gemini ha sovraperformato GPT-4. In 30 casi il nuovo modello linguistico di Google si è rivelato migliore di quello della concorrenza. Ciò dimostra la capacità del modello di comprendere appieno la lingua.

Leggi anche: Human Brain Project: un tentativo di imitare il cervello umano

Esistono versioni diverse?

Google descrive questa intelligenza artificiale come un modello flessibile che può funzionare su qualsiasi dispositivo: dai data center di Google ai dispositivi mobili. Per ottenere questa scalabilità, Gemini è disponibile in tre versioni: Nano, Pro e Ultra.

Google Gemelli

Parliamo più nel dettaglio delle diverse versioni di Gemini.

  • Gemelli Nano: progettato per funzionare sugli smartphone, in particolare Google Pixel 8. È progettato per eseguire attività che richiedono un'elaborazione efficiente da parte dell'intelligenza artificiale senza connettersi a server esterni, come suggerire risposte in programmi di chat o riassumere testi. Questo modello di dispositivo compatto ha circa 6 miliardi di parametri.
  • Gemelli Pro: viene eseguito nei data center di Google. Pro è progettato per funzionare con l'ultima versione del chatbot Bard AI. È in grado di fornire tempi di risposta rapidi e comprendere query complesse. Un modello di medie dimensioni ha circa 100 miliardi di parametri ed è il nucleo dell'intelligenza artificiale conversazionale di Bard. Pro sarà disponibile tramite Google Cloud.
  • Gemelli Ultra: sebbene la versione Ultra non sia ancora ampiamente disponibile, Google la descrive come il modello con le migliori prestazioni, superando "l'attuale stato dell'arte per 30 dei 32 test accademici ampiamente utilizzati nella ricerca sui modelli linguistici di grandi dimensioni (LLM). " Essendo la versione più grande e potente, Ultra riceverà più di 1 trilione di parametri. Sarà situato nei data center. Ultra è adattato per l'uso aziendale. La versione è progettata per eseguire compiti molto complessi. Google prevede di rilasciarlo dopo la fine dell'attuale fase di test. Cioè, la versione più potente non è ancora disponibile per gli utenti.

Interessante anche: Google Bard AI: tutto ciò che devi sapere

- Annuncio pubblicitario -

Come accedere ai Gemelli?

L'intelligenza artificiale nelle versioni Nano e Pro è ora disponibile nei prodotti Google come rispettivamente gli smartphone Google Pixel 8 e il chatbot Bard. Google prevede di integrarlo eventualmente nel suo motore di ricerca, nella pubblicità, nel servizio di posta elettronica Gmail, nel browser Chrome e in altri servizi.

Gli sviluppatori e i clienti aziendali potranno accedere a Pro tramite l'API Gemini in Google AI Studio e Google Cloud Vertex AI a partire dal 13 dicembre 2023. Sviluppatori Android avranno accesso al modello in versione Nano tramite AICore, che sarà disponibile in una prima anteprima.

Leggi anche: Samsung Galaxy Flip5 contro Motorola Razr 40 Ultra: Battaglia dei Due Yokozuns

Gemelli a Google Bard: cosa cambierà?

Secondo le informazioni fornite durante la presentazione, il modello consentirà a Google Bard di gestire meglio problemi più complessi, come affermato:

“Abbiamo progettato Gemini in modo che il modello sia naturalmente multimodale e pre-addestrato su molteplici modalità fin dall’inizio. Lo abbiamo poi perfezionato aggiungendo più dati multimodali per migliorare le prestazioni. Di conseguenza, Gemini comprende e deduce facilmente molto meglio dei precedenti modelli multimodali e vanta capacità all’avanguardia in quasi tutte le aree.

Le straordinarie capacità multimodali di Gemini ti aiutano a comprendere complesse informazioni testuali e visive. Sono particolarmente utili quando si tratta di estrarre informazioni specifiche da enormi set di dati. La straordinaria capacità di questo modello di estrarre l'essenza delle informazioni da centinaia di migliaia di documenti leggendoli, filtrandoli e analizzandoli contribuirà senza dubbio a nuove, fulminee scoperte in vari campi, dalla scienza alla finanza."

Durante la presentazione è stato dimostrato un esempio di studio complesso, che contiene più di 200mila record, alcuni dei quali dovevano essere aggiornati con nuovi dati. Come avrai intuito, farlo manualmente richiederebbe molto tempo, quindi gli autori dello studio hanno utilizzato Gemini per preparare il codice che prendeva l'input e apportava gli aggiornamenti necessari. Un altro esempio più reale è l’utilizzo del modello linguistico di Google per spiegare problemi di matematica o fisica.

Google Gemelli

I dati immessi qui erano una foto/scansione di un compito di una lezione scolastica. Il sistema è stato in grado di elaborare la grafica e il testo memorizzati lì e quindi indicare quali parti dei compiti sono state svolte correttamente e quali necessitavano di maggiore attenzione. La presentazione ha mostrato che un utente può chiedere ripetutamente a Gemini di spiegare un'attività e ogni tentativo successivo deve essere spiegato in un linguaggio più semplice. Quanto saranno accurati e corretti i Gemelli, ovviamente, verrà verificato da chi è interessato, ma la capacità di leggere ed elaborare il testo direttamente dalle foto è impressionante. Come aggiunto durante la presentazione:

"Ai Gemelli è stato insegnato a riconoscere e comprendere testi, immagini, suoni e altro allo stesso tempo. Grazie a ciò, comprende meglio le sfumature delle informazioni e può rispondere a domande complesse. È particolarmente efficace nello spiegare argomenti relativi alla matematica e alla fisica, quindi può servire come aiuto personale per i compiti".

Gemelli negli smartphone Google Pixel

Google si è anche vantato del fatto che Gemini abbia "imparato" sui nuovi chipset TPUv5 e prevede di introdurre Gemini Ultra all'inizio del 2024, che utilizzerà Bard Advanced, una nuova versione della versione consumer del modello vocale del gigante. Gemini Ultra è attualmente in fase di test ed è già disponibile per esperti di sicurezza selezionati.

Google Gemelli

L'ultima informazione importante riguarda l'introduzione di Gemini negli smartphone Google Pixel 8. Ciò consentirà, tra le altre cose, di creare risposte rapide tramite l'applicazione Gboard nei messenger. Il primo è WhatsApp, ma l'anno prossimo tali soluzioni appariranno in altre applicazioni legate alla comunicazione. Tuttavia, questo è solo l'inizio, poiché Google ha annunciato molti nuovi strumenti AI per gli smartphone Pixel 8, che saranno disponibili su altri dispositivi in ​​futuro. Android. Tuttavia, questi sono ulteriori piani e al momento non sono stati forniti dettagli.

In che modo Gemini è diverso dagli altri modelli di intelligenza artificiale, come GPT-4?

Il nuovo modello Gemini di Google sembra essere uno dei modelli AI più grandi e avanzati fino ad oggi, anche se il rilascio del modello Ultra lo determinerà sicuramente. Rispetto ad altri modelli popolari che attualmente utilizzano chatbot AI, Gemini si distingue per la propria funzionalità multimodale, mentre altri modelli come GPT-4 si affidano a plugin e integrazione per essere veramente multimodali.

Preoccupazioni circa l’accuratezza e l’imparzialità

Sebbene Gemini rappresenti un importante passo avanti nello sviluppo delle capacità dell’intelligenza artificiale, presenta carenze comuni ad altri importanti modelli linguistici. Innanzitutto questa è la possibilità di creare false informazioni. I pregiudizi si basano anche sui dati di addestramento disponibili per il nuovo modello linguistico. Vale anche la pena menzionare la comprensione limitata del mondo reale. Google riconosce che il nuovo modello Gemini può commettere errori, fornire fatti non basati su prove e contraddire il buon senso.

Google Gemelli

Sono necessari ulteriori test, soprattutto per Gemini Ultra, che dispone di nuove funzionalità non ancora completamente esplorate. Google si impegna a valutare attentamente Gemini per ridurre al minimo i potenziali danni.

Interessante anche: Tutto su Microsoft Copilota: il futuro o la strada sbagliata?

Il futuro è con i Gemelli

Il lancio di Gemini da parte di Google ha inaugurato una nuova era nello sviluppo dell’intelligenza artificiale. Con le sue migliori prestazioni rispetto ai modelli precedenti e alle linee di base umane, Gemini indica le possibilità future dell’intelligenza artificiale, ma necessita ancora di ulteriori ricerche per affrontare alcune carenze.

In futuro, puoi aspettarti che Gemini fornisca funzionalità più utili e intelligenti nei prodotti Google. In futuro, l'azienda prevede di continuare ad espandere Gemini oltre l'inglese e di basarsi sulla metodologia del suo modello principale.

Possiamo solo guardare e sperare che Google sappia cosa sta facendo.

Leggi anche: 

Yuri Svitlyk
Yuri Svitlyk
Figlio dei Carpazi, genio non riconosciuto della matematica, "avvocato"Microsoft, altruista pratico, sinistra-destra
- Annuncio pubblicitario -
Iscrizione
Avvisare su
ospite

0 Commenti
Recensioni incorporate
Visualizza tutti i commenti