O Google lançou o Gemini 3 Flash, uma versão mais rápida e acessível de seu modelo Gemini 3 lançado recentemente. A mudança foi projetada para competir diretamente com OpenAI e está imediatamente tornando o Gemini 3 Flash o modelo padrão no aplicativo Gemini e nos recursos de pesquisa baseados em IA. Este desenvolvimento sinaliza uma escalada no cenário de IA em rápida evolução, onde a velocidade, o desempenho e o custo são os principais diferenciais.
Benchmarks de desempenho: Gemini 3 Flash versus concorrentes
O novo modelo demonstra melhorias significativas em relação ao seu antecessor, Gemini 2.5 Flash. Os testes mostram que o Gemini 3 Flash oferece desempenho comparável a modelos líderes como Gemini 3 Pro e GPT-5.2 da OpenAI em diversas áreas principais. Por exemplo, no Último Exame da Humanidade (uma referência de conhecimento amplo), o Gemini 3 Flash obteve 33,7%, igualando o GPT-5.2 com 34,5% e superando o Gemini 2.5 Flash com 11%.
Ainda mais impressionante, o Gemini 3 Flash lidera em raciocínio multimodal, alcançando uma pontuação de 81,2% no benchmark MMMU-Pro, superando todos os outros modelos testados. Esses resultados confirmam o esforço agressivo do Google por uma solução competitiva de IA.
Lançamento para consumidores e empresas
O Google está implantando imediatamente o Gemini 3 Flash como padrão para todos os usuários do aplicativo Gemini, substituindo o antigo Gemini 2.5 Flash. Os usuários que necessitam de recursos matemáticos ou de codificação mais avançados ainda podem mudar para o modelo Pro por meio do seletor de modelos.
Os pontos fortes do modelo incluem compreensão multimodal aprimorada, o que significa que ele pode processar e responder a entradas combinadas, como vídeos, esboços e gravações de áudio. O Google destaca que isso permite recursos como:
- Analisando vídeos de pickleball para dicas.
- Adivinhar esboços a partir de desenhos de usuários.
- Geração de questionários a partir de gravações de áudio.
Os usuários corporativos, incluindo JetBrains, Figma, Cursor, Harvey e Latitude, já estão integrando o Gemini 3 Flash via Vertex AI e Gemini Enterprise. Os desenvolvedores podem acessar o modelo por meio da API do Google e da nova ferramenta de codificação Antigravity.
Preços e ganhos de eficiência
O Gemini 3 Flash custa US$ 0,50 por 1 milhão de tokens de entrada e US$ 3,00 por 1 milhão de tokens de saída – um pouco mais alto que o Gemini 2.5 Flash (US$ 0,30/US$ 2,50). No entanto, o Google afirma que o novo modelo oferece velocidades três vezes mais rápidas enquanto supera o modelo 2.5 Pro.
Além disso, o Gemini 3 Flash usa aproximadamente 30% menos tokens para muitas tarefas em comparação com o modelo mais antigo, o que significa que os usuários podem reduzir potencialmente os custos, apesar da taxa por token um pouco mais alta. Isso o torna uma solução econômica para aplicações de alto volume.
O cenário competitivo
O lançamento do Gemini 3 Flash ocorre em meio a uma competição acirrada com o OpenAI. Os relatórios indicam que a OpenAI emitiu um alerta interno “Code Red” depois que o tráfego do ChatGPT diminuiu após os recentes lançamentos de IA do Google. A OpenAI respondeu lançando o GPT-5.2 e um novo modelo de geração de imagens, ao mesmo tempo que enfatizou seu crescente uso empresarial.
O Google reconhece o impulso de inovação em todo o setor e acredita que a competição contínua está impulsionando o progresso. A empresa processa mais de 1 trilhão de tokens diariamente por meio de sua API, sinalizando seu compromisso em manter uma posição de liderança no desenvolvimento de IA.
“Todos esses modelos continuam sendo incríveis, desafiando uns aos outros, ultrapassando fronteiras”, diz Tulsee Doshi, chefe de produto para modelos Gemini do Google.
O lançamento do Gemini 3 Flash ressalta a intenção do Google de continuar sendo um participante importante na corrida da IA, oferecendo uma combinação competitiva de desempenho, velocidade e eficiência de custos.
