Lançamento do Gemini 2.0 inaugura caminho para Google estrear sua "era dos agentes"

Nova versão traz geração de imagens e áudios nativos, além de velocidade e precisão aprimoradas

Repórter

Publicado em 11 de dezembro de 2024 às 17h40.

Última atualização em 11 de dezembro de 2024 às 17h41.

Nesta quarta-feira, 11, o Google revelou o Gemini 2.0 Flash, o modelo de inteligência artificial mais avançado já lançado pela empresa. Este marco reforça as ambições da gigante da tecnologia em liderar o desenvolvimento de agentes de IA, ferramentas projetadas para compreender, interagir e agir no mundo com supervisão humana.

O Gemini 2.0 Flash amplia as capacidades multimodais já apresentadas em versões anteriores, permitindo agora a geração nativa de imagens e áudio, além de texto.

Em testes iniciais, o modelo demonstrou avanços em velocidade, precisão e habilidades matemáticas, estabelecendo uma base sólida para o que o Google chama de “era agêntica”.

O que há de novo no Gemini 2.0 Flash?

O novo modelo representa um salto significativo em relação ao Gemini 1.5 Pro. Entre as principais melhorias, destacam-se:

Velocidade duplicada em tarefas como codificação e análise de imagens;
Maior precisão factual, com avanços em habilidades matemáticas e contextuais;
Geração e edição de imagens e áudio, incluindo narrações em oito vozes otimizadas para diferentes idiomas e sotaques;
Integração com aplicativos externos e ferramentas do Google, como Search, Lens e Maps.

Além disso, o Gemini 2.0 Flash utiliza a tecnologia SynthID para inserir marca d’água em todas as imagens e áudios gerados, garantindo que os conteúdos sintéticos sejam identificados e prevenindo abusos como deepfakes.

A partir de hoje, uma versão experimental do modelo estará disponível para desenvolvedores por meio das plataformas AI Studio e Vertex AI, mas recursos como geração de áudio e imagem serão liberados para mais usuários apenas em janeiro.

Agentes de IA

O lançamento do Gemini 2.0 Flash ocorre em um momento estratégico para o Google. A empresa tem investido em agentes de inteligência artificial, como os projetos Astra e Mariner, que buscam combinar multimodalidade com memória e capacidade de ação.

Durante uma demonstração recente no campus do Google, o Project Astra exibiu sua capacidade de interpretar imagens e interagir. No exemplo apresentado, o agente foi capaz de reconhecer e descrever obras de arte, acessar informações em tempo real e contextualizar interações passadas.

Por sua vez, o Project Mariner, projetado para operar diretamente em navegadores, realizou tarefas como adicionar ingredientes de receitas a um carrinho de compras em um site de supermercado. Apesar da lentidão do processo, a demonstração destacou o potencial de agentes que não apenas respondem, mas também executam tarefas práticas com supervisão direta do usuário.

No entanto, o Google vê o lançamento do Gemini 2.0 como uma peça fundamental para refinar essa tecnologia. Ao integrar o modelo com ferramentas como o Android Studio, Firebase e Gemini Code Assist, a empresa espera explorar novas possibilidades e atender às necessidades de desenvolvedores e consumidores.

1/7 (O MIT Computer Science and Artificial Intelligence Laboratory (CSAIL), em Cambridge, Massachusetts, desenvolveu o sistema de diagnóstico de câncer de mama baseado em IA, reduzindo erros em 15%.)
2/7 (O Google AI, com sede em Mountain View, Califórnia, criou o AlphaGo, o primeiro programa de IA a derrotar um campeão mundial de Go, revolucionando a pesquisa em aprendizado profundo.)
3/7 Localizado em Londres, Reino Unido, o DeepMind Lab é famoso pelo desenvolvimento do AlphaFold, um programa de IA que previu estruturas de proteínas com precisão sem precedentes, impactando a biologia molecular. (Localizado em Londres, Reino Unido, o DeepMind Lab é famoso pelo desenvolvimento do AlphaFold, um programa de IA que previu estruturas de proteínas com precisão sem precedentes, impactando a biologia molecular.)
4/7 (O IBM Watson Research Center, em Yorktown Heights, Nova York, desenvolveu a IA Watson, que venceu campeões humanos no programa de TV Jeopardy!, demonstrando avanços significativos em processamento de linguagem natural.)
5/7 (O Baidu Research Lab, em Pequim, China, é conhecido por seu sistema de reconhecimento de voz Deep Speech, que alcançou uma precisão de 97% na transcrição de áudio, superando as tecnologias anteriores.)
6/7 (O Berkeley Artificial Intelligence Research (BAIR) Lab, na Universidade da Califórnia, em Berkeley, criou algoritmos avançados de robótica, incluindo o Dex-Net, que melhorou a precisão da manipulação robótica em 99%.)
7/7 (O centro da Meta AI Research SuperCluster (RSC) tem um dos supercomputadores de IA mais rápidos da atualidade. Com ele, a empresa desenvolveu o sistema de tradução automática baseado em IA que suporta mais de 100 idiomas, melhorando a comunicação global em plataformas sociais da empresa.)

Acompanhe tudo sobre:Google

Austrália planeja que gigantes do setor de tecnologia a paguem por notícias

Mais de Inteligência Artificial

Dizer 'obrigada' e 'por favor' para o ChatGPT pode custar caro; entenda

Mais na Exame

Imagem referente à matéria: Alvo do Corinthians, Tite anuncia pausa na carreira por tempo indeterminado

Esporte

Inteligência Artificial

Lançamento do Gemini 2.0 inaugura caminho para Google estrear sua "era dos agentes"

Nova versão traz geração de imagens e áudios nativos, além de velocidade e precisão aprimoradas

O que há de novo no Gemini 2.0 Flash?

Mais de Inteligência Artificial

Dizer 'obrigada' e 'por favor' para o ChatGPT pode custar caro; entenda

Novos modelos de IA da OpenAI têm mais 'alucinações' que os anteriores; entenda

Autenticidade em crise: a inteligência artificial vai roubar a nossa identidade?

Como funciona a inteligência artificial do Google que quer 'traduzir' o idioma dos golfinhos

Mais na Exame

Alvo do Corinthians, Tite anuncia pausa na carreira por tempo indeterminado

Na guerra comercial, EUA taxam em até 3.400% painéis solares do Sudeste Asiático

Bitcoin hoje: criptomoeda dispara após feriado da páscoa, acompanhando máxima do ouro

Vai ter que vender o Chrome? Google volta aos tribunais para tentar evitar divisão