O que é Gemini? Tudo o que você deve saber sobre o novo modelo de IA do Google

Introdução ao Gemini O novo modelo de inteligência artificial do Google que você precisa conhecer

Página do Google Gemini em um laptop lê, bem-vindo à era Gemini

O que é o Google Gemini?

Gemini é um novo e poderoso modelo de inteligência artificial do Google que pode entender não apenas texto, mas também imagens, vídeos e áudio. Como um modelo multimodal, Gemini é descrito como capaz de completar tarefas complexas em matemática, física e outras áreas, além de entender e gerar código de alta qualidade em várias linguagens de programação. 

Atualmente está disponível por meio de integrações com o Google Bard e o Google Pixel 8 e gradualmente será incorporado a outros serviços do Google. 

Também: ChatGPT vs Bing Chat vs Google Bard: Qual é o melhor chatbot de IA?

“Gemini é o resultado de esforços colaborativos em larga escala por equipes em todo o Google, incluindo nossos colegas do Google Research”, segundo Dennis Hassabis, CEO e co-fundador do Google DeepMind. “Ele foi construído desde o início para ser multimodal, o que significa que ele pode generalizar e entender, operar e combinar diferentes tipos de informações, incluindo texto, código, áudio, imagem e vídeo.”

Quem criou o Gemini?

Gemini foi criado pelo Google e pela Alphabet, empresa mãe do Google, e lançado como o modelo de IA mais avançado da empresa até o momento. O Google DeepMind também contribuiu significativamente para o desenvolvimento do Gemini. 

Também: A nova Deep Search do Bing usa o GPT-4 para fornecer resultados de busca mais detalhados

Existem diferentes versões de Gemini?

O Google descreve o Gemini como um modelo flexível capaz de rodar em desde os centros de dados do Google até dispositivos móveis. Para alcançar essa escalabilidade, o Gemini está sendo lançado em três tamanhos: Gemini Nano, Gemini Pro e Gemini Ultra.

  • Gemini Nano: O tamanho do modelo Gemini Nano foi projetado para funcionar em smartphones, especificamente no Google Pixel 8. Ele foi criado para realizar tarefas no dispositivo que exigem processamento eficiente de IA sem conexão com servidores externos, como sugerir respostas em aplicativos de chat ou resumir texto. 
  • Gemini Pro: Rodando nos centros de dados do Google, o Gemini Pro foi projetado para alimentar a versão mais recente do chatbot de IA da empresa, o Bard. Ele é capaz de oferecer tempos de resposta rápidos e entender consultas complexas. 
  • Gemini Ultra: Embora ainda não esteja disponível para uso generalizado, o Gemini Ultra é descrito pelo Google como seu modelo mais capaz, superando “os resultados atuais do estado da arte em 30 dos 32 benchmarks acadêmicos amplamente utilizados na pesquisa e desenvolvimento de modelos de linguagem” Ele será lançado após concluir sua fase atual de testes.

Como você pode acessar o Gemini?

O Gemini agora está disponível em produtos do Google em seus tamanhos Nano e Pro, como no telefone Pixel 8 e no chatbot Bard, respectivamente. O Google planeja integrar o Gemini ao longo do tempo em sua Pesquisa, Anúncios, Chrome e outros serviços. 

Também: Eu pedi para o DALL-E 3 criar um retrato de todos os estados dos EUA e os resultados foram gloriosamente estranhos

Desenvolvedores e clientes empresariais poderão acessar o Gemini Pro por meio da API Gemini no AI Studio do Google e no Vertex AI do Google Cloud a partir de 13 de dezembro. Os desenvolvedores de Android terão acesso ao Gemini Nano via AICore, que estará disponível em uma visualização antecipada.

Como o Gemini difere de outros modelos de IA, como o GPT-4?

O novo modelo Gemini do Google parece ser um dos maiores e mais avançados modelos de IA até o momento, embora o lançamento do modelo Ultra seja o responsável por determinar isso com certeza. Em comparação com outros modelos populares que alimentam chatbots de IA atualmente, o Gemini se destaca devido à sua característica multimodal nativa, enquanto outros modelos, como o GPT-4, dependem de plugins e integrações para serem verdadeiramente multimodais.

Também: Google diz que Bard é agora mais inteligente que o ChatGPT, graças à atualização do Gemini

Um gráfico de comparação do Google mostra como o Gemini Ultra e o Pro se comparam ao GPT-4 e ao Whisper da OpenAI, respectivamente.

Em comparação com o GPT-4, um modelo principalmente baseado em texto, o Gemini realiza facilmente tarefas multimodais de forma nativa. Enquanto o GPT-4 se destaca em tarefas relacionadas à linguagem, como criação de conteúdo e análise de texto complexo de forma nativa, ele recorre aos plugins da OpenAI para realizar análise de imagens e acessar a web, e depende do DALL-E 3 e Whisper para gerar imagens e processar áudio.

Também: Os melhores chatbots de IA: ChatGPT e outras alternativas notáveis

O Gemini do Google também parece ser mais focado em produtos do que outros modelos disponíveis atualmente. Ele está integrado ao ecossistema da empresa ou tem planos de estar, pois está alimentando os dispositivos Bard e Pixel 8. Outros modelos, como o GPT-4 e o Llama da Meta, são mais voltados para serviços e estão disponíveis para vários desenvolvedores de terceiros para aplicativos, ferramentas e serviços.