O Google revelou hoje (06) sua mais recente inovação: o Gemini, um modelo de inteligência artificial (IA) de vanguarda, considerado o projeto científico e tecnológico mais ambicioso da empresa até a data. Desenvolvido em colaboração com as equipes do Google DeepMind e Google Research, o Gemini representa um marco na IA. Veja o vídeo abaixo!
A nova inteligência artificial, em sua versão inaugural, terá três variantes distintas:
- Gemini Ultra: O modelo mais robusto, ideal para tarefas complexas.
- Gemini Pro: Adaptado para uma ampla gama de tarefas.
- Gemini Nano: Otimizado para eficiência em dispositivos móveis.
Características do Gemini
Este modelo de IA é multimodal, habilmente combinando e processando diferentes tipos de dados, incluindo textos, imagens, áudios, vídeos e linguagens de programação. Sua versatilidade permite eficácia tanto em dispositivos móveis quanto em data centers, otimizando significativamente o desenvolvimento e a escalabilidade de soluções de IA.
Diferentemente dos modelos tradicionais, que são treinados separadamente em várias modalidades antes de serem combinados, o Gemini foi concebido como um modelo multimodal nativo. Isso permite um entendimento e raciocínio superiores sobre informações diversificadas desde sua concepção, graças ao treinamento com dados multimodais.
Disponibilidade e Aplicações
- O Bard com Gemini Pro já está disponível em inglês em mais de 170 países.
- O Gemini também chega ao Pixel 8 Pro com o modelo Gemini Nano, incluindo recursos como “Summarize” no aplicativo Recorder e “Smart Reply” no Gboard.
- Nos próximos meses, o Gemini será integrado a produtos chave do Google, como Busca, Ads, Chrome e Duet AI.
Para desenvolvedores e clientes corporativos, o Gemini Pro estará acessível via API do Google AI Studio e Vertex AI a partir de 13 de dezembro. Além disso, o Gemini Ultra passará por verificações de segurança antes de ser disponibilizado no próximo ano.
Benchmarking
O Gemini Ultra excedeu expectativas, superando 30 dos 32 benchmarks acadêmicos em testes que abrangem desde compreensão de imagens até programação e raciocínio matemático. Para quem quiser ler o relatório técnico do Gemini, ele está disponível neste link.