Root NationArtigosTecnologiasO que é Gemini: tudo sobre o novo modelo de IA do Google

O que é Gemini: tudo sobre o novo modelo de IA do Google

-

O Google acaba de lançar seu modelo de IA mais poderoso já chamado Gemini. O que ela é e o que ela pode fazer? Sobre tudo em nosso artigo.

O Google vem desenvolvendo suas próprias ferramentas de IA há anos. Com o lançamento público do ChatGPT-3 da OpenAI, a empresa que administra o mecanismo de busca mais popular do mundo também criou uma ferramenta semelhante, a Bard. Mas esta ferramenta ainda perdeu para os concorrentes, o que o Google não podia permitir. Portanto, não é de surpreender que o mundo tenha visto recentemente o Gemini, novo modelo de linguagem do Google, que conhecemos durante a apresentação.

Ele foi projetado não apenas para melhorar o anterior LLM (Large Language Model) da gigante, mas também para oferecer possibilidades completamente novas na área de processamento de texto, gráficos e som.

Então, vamos dar uma olhada mais de perto no novo modelo de linguagem do Google Gemini.

Também interessante: Projeto OpenAI Q*: o que é e por que o projeto é uma preocupação

O que é o Google Gêmeos?

Este é um novo e poderoso modelo de inteligência artificial do Google, que pode compreender não apenas texto, mas também imagens, vídeos e áudio. Este modelo multimodal é descrito como capaz de realizar tarefas complexas em matemática, física e outros domínios, bem como compreender e gerar código de alta qualidade em uma variedade de linguagens de programação.

Google Gêmeos

Atualmente, o Gemini está disponível por meio de integração com Google Bard e Google Pixel 8 e será gradualmente incluído em outros serviços do Google.

“Gemini é o resultado de um enorme esforço colaborativo entre as equipes do Google, incluindo nossos colegas do Google Research,” — disse Dennis Hassabis, CEO e cofundador do Google DeepMind. "Ele foi construído desde o início para ser multimodal, o que significa que pode generalizar e compreender, operar e combinar diferentes tipos de informações, incluindo texto, código, áudio, imagens e vídeo."

- Propaganda -

Também interessante: Nem tudo que chamamos de IA é, na verdade, inteligência artificial. Aqui está o que você precisa saber

Quem criou o modelo?

Google Gêmeos

Como você provavelmente já deve ter adivinhado, o Gemini foi criado pelo Google e pela Alphabet, empresa controladora do Google, e é o modelo de IA mais avançado da empresa até o momento. A divisão DeepMind do Google também deu uma contribuição significativa ao seu desenvolvimento. Ainda não se sabe quantos funcionários participaram do desenvolvimento e quais recursos foram destinados para isso, mas conhecendo as capacidades do Google, podemos ter certeza que é uma quantia muito grande.

Também interessante: Windows 12: Qual será o novo sistema operacional

Oportunidades

Como observei acima, é um modelo multimodal, o que significa que pode compreender, operar e combinar diferentes tipos de dados, incluindo texto, código, áudio, imagens e vídeo. Ele fornece melhores habilidades de compreensão, pensamento e codificação em comparação com sistemas de IA anteriores.

Google Gêmeos

As principais capacidades do modelo são:

  • Processamento de linguagem natural para tarefas como tradução, resumo e diálogo
  • Pensamento matemático e resolução de problemas
  • Capacidade de gerar código e documentação
  • Compreender imagens, áudio e vídeo
  • Multitarefa em diferentes domínios

Como você pode ver, os recursos são superiores aos de outros modelos.

Em testes de compreensão linguística, pensamento matemático e codificação, o Gemini Ultra superou modelos como o GPT-4. Em particular, é o primeiro modelo a superar o desempenho de nível humano no teste Massive Multitask Language Understanding (MMLU), alcançando mais de 90% de precisão.

Em 32 testes acadêmicos de um grande estudo de modelo de linguagem, Gemini superou o GPT-4. Em 30 casos, o novo modelo de linguagem do Google foi melhor que o concorrente. Isso demonstra a capacidade do modelo de compreender totalmente a linguagem.

Leia também: Projeto Cérebro Humano: Uma tentativa de imitar o cérebro humano

Existem versões diferentes?

O Google descreve esta IA como um modelo flexível que pode funcionar em qualquer dispositivo: desde data centers do Google até dispositivos móveis. Para atingir essa escalabilidade, o Gemini vem em três versões: Nano, Pro e Ultra.

Google Gêmeos

Vamos falar mais detalhadamente sobre as diferentes versões do Gemini.

  • Gêmeos Nano: projetado para funcionar em smartphones, em especial o Google Pixel 8. Foi projetado para realizar tarefas que exigem processamento eficiente por inteligência artificial sem conexão com servidores externos, como sugerir respostas em programas de chat ou resumir textos. Este modelo de dispositivo compacto possui cerca de 6 bilhões de parâmetros.
  • Gêmeos Pro: é executado em data centers do Google. O Pro foi projetado para funcionar com a versão mais recente do chatbot Bard AI. É capaz de fornecer tempos de resposta rápidos e compreender consultas complexas. Um modelo de tamanho médio tem aproximadamente 100 bilhões de parâmetros e é o núcleo da IA ​​conversacional da Bard. O Pro estará disponível através do Google Cloud.
  • Gêmeos Ultra: embora a versão Ultra ainda não esteja amplamente disponível, o Google a descreve como seu modelo de melhor desempenho, excedendo "o estado da arte atual para 30 dos 32 testes acadêmicos amplamente utilizados em pesquisas de modelos de linguagem grande (LLM). " Por ser a versão maior e mais poderosa, o Ultra receberá mais de 1 trilhão de parâmetros. Ele estará localizado em data centers. Ultra está adaptado para uso corporativo. A versão foi projetada para realizar tarefas muito complexas. O Google planeja lançá-lo após o término da atual fase de testes. Ou seja, a versão mais poderosa ainda não está disponível para os usuários.

Também interessante: Google Bard AI: tudo o que você precisa saber

- Propaganda -

Como acessar Gêmeos?

A IA nas versões Nano e Pro agora está disponível em produtos Google, como os smartphones Google Pixel 8 e o chatbot Bard, respectivamente. O Google planeja eventualmente integrá-lo ao seu mecanismo de busca, publicidade, serviço de e-mail Gmail, navegador Chrome e outros serviços.

Desenvolvedores e clientes corporativos poderão acessar o Pro por meio da API Gemini no Google AI Studio e no Google Cloud Vertex AI a partir de 13 de dezembro de 2023. Desenvolvedores Android terá acesso ao modelo da versão Nano via AICore, que estará disponível em uma prévia.

Leia também: Samsung Galaxy Flip5 versus Motorola Razr 40 Ultra: Batalha dos Dois Yokozuns

Gêmeos no Google Bard: O que vai mudar?

Segundo informações prestadas durante a apresentação, o modelo permitirá ao Google Bard lidar melhor com problemas mais complexos, conforme afirmado:

“Projetamos o Gemini para que o modelo seja naturalmente multimodal e pré-treinado em múltiplas modalidades desde o início. Em seguida, refinamo-lo adicionando mais dados multimodais para melhorar o desempenho. Como resultado, o Gemini compreende e infere facilmente muito melhor do que os modelos multimodais anteriores e possui capacidades de última geração em quase todas as áreas.

As extraordinárias capacidades multimodais do Gemini ajudam você a compreender informações textuais e visuais complexas. Eles são especialmente úteis quando se trata de extrair informações específicas de grandes conjuntos de dados. A extraordinária capacidade deste modelo para extrair a essência da informação de centenas de milhares de documentos através da leitura, filtragem e análise dos mesmos contribuirá, sem dúvida, para novas descobertas rápidas em vários campos, da ciência às finanças."

Durante a apresentação foi demonstrado um exemplo de estudo complexo, que contém mais de 200 mil registros, alguns dos quais tiveram que ser atualizados de acordo com novos dados. Como você deve ter adivinhado, fazer isso manualmente consumiria muito tempo, então os autores do estudo usaram o Gemini para preparar o código que recebeu a entrada e fez as atualizações necessárias. Outro exemplo mais real é usar o modelo de linguagem do Google para explicar problemas de matemática ou física.

Google Gêmeos

Os dados de entrada aqui foram uma foto/digitalização de uma tarefa de uma aula escolar. O sistema conseguiu processar os gráficos e textos ali armazenados e depois indicar quais partes da lição de casa foram feitas corretamente e quais precisavam de mais atenção. A apresentação mostrou que um usuário pode pedir repetidamente ao Gemini para explicar uma tarefa, e cada tentativa subsequente deve ser explicada em uma linguagem mais simples. O quão preciso e correto será o Gemini, é claro, será verificado pelos interessados, mas a capacidade de ler e processar texto diretamente das fotos é impressionante. Conforme adicionado durante a apresentação:

"Gêmeos foi ensinado a reconhecer e compreender textos, imagens, sons e muito mais ao mesmo tempo. Graças a isso, ele entende melhor as nuances das informações e pode responder perguntas complexas. É particularmente eficaz na explicação de tópicos relacionados com matemática e física, pelo que pode servir como auxiliar pessoal nos trabalhos de casa.".

Gêmeos em smartphones Google Pixel

O Google também se gabou de que o Gemini “aprendeu” com os novos chipsets TPUv5 e planeja lançar o Gemini Ultra no início de 2024, que usará o Bard Advanced, uma nova versão da versão para consumidor do modelo de fala da gigante. Gemini Ultra está atualmente em testes e já está disponível para especialistas em segurança selecionados.

Google Gêmeos

A última informação importante é a introdução do Gemini nos smartphones Google Pixel 8. Isto permitirá, entre outras coisas, criar respostas rápidas através da aplicação Gboard nos mensageiros. O primeiro é o WhatsApp, mas no próximo ano tais soluções aparecerão em outros aplicativos relacionados à comunicação. No entanto, isso é apenas o começo, já que o Google anunciou muitas novas ferramentas de IA para os smartphones Pixel 8, e elas estarão disponíveis em alguns outros dispositivos no futuro. Android. No entanto, estes são planos adicionais e nenhum detalhe foi fornecido neste momento.

Qual a diferença entre o Gemini e outros modelos de IA, como o GPT-4?

O novo modelo Gemini do Google parece ser um dos maiores e mais avançados modelos de IA até o momento, embora o lançamento do modelo Ultra determine isso com certeza. Comparado a outros modelos populares que atualmente usam chatbots de IA, o Gemini se destaca por seu próprio recurso multimodal, enquanto outros modelos como o GPT-4 contam com plug-ins e integração para serem verdadeiramente multimodais.

Preocupações com precisão e imparcialidade

Embora o Gemini seja um grande avanço no desenvolvimento de capacidades de inteligência artificial, tem as mesmas deficiências que outros modelos de linguagem importantes. Em primeiro lugar, esta é a possibilidade de criação de informações falsas. Os preconceitos também se baseiam nos dados de treinamento disponíveis para o novo modelo de linguagem. Também vale a pena mencionar a compreensão limitada do mundo real. O Google admite que o novo modelo Gemini pode cometer erros, fornecer fatos que não são baseados em evidências e contradizer o bom senso.

Google Gêmeos

Mais testes são necessários, especialmente para o Gemini Ultra, que possui novas capacidades que ainda não foram totalmente exploradas. O Google está empenhado em avaliar cuidadosamente o Gemini para minimizar possíveis danos.

Também interessante: Tudo sobre Microsoft Copiloto: o futuro ou o caminho errado?

O futuro está com Gêmeos

O lançamento do Gemini pelo Google inaugurou uma nova era de desenvolvimento de IA. Com seu melhor desempenho em comparação com modelos anteriores e linhas de base humanas, o Gemini aponta para as possibilidades futuras da inteligência artificial, mas ainda precisa de mais pesquisas para solucionar certas deficiências.

No futuro, você pode esperar que o Gemini forneça recursos mais úteis e inteligentes nos produtos do Google. No futuro, a empresa planeja continuar a expandir o Gemini além do inglês e desenvolver sua metodologia de modelo principal.

Só podemos observar e esperar que o Google saiba o que está fazendo.

Leia também: 

Yuri Svitlyk
Yuri Svitlyk
Filho das Montanhas dos Cárpatos, gênio não reconhecido da matemática, "advogado"Microsoft, altruísta prático, esquerda-direita
- Propaganda -
Inscrever-se
Notificar sobre
convidado

0 Comentários
Avaliações incorporadas
Ver todos os comentários