Google a lancé Gemini 3 Flash, une version plus rapide et plus abordable de son modèle Gemini 3 récemment sorti. Cette décision est conçue pour concurrencer directement OpenAI et fait immédiatement de Gemini 3 Flash le modèle par défaut de l’application Gemini et des fonctionnalités de recherche basées sur l’IA. Cette évolution marque une escalade dans le paysage de l’IA en évolution rapide, où la vitesse, les performances et le coût sont des différenciateurs clés.
Benchmarks de performances : Gemini 3 Flash par rapport aux concurrents
Le nouveau modèle présente des améliorations significatives par rapport à son prédécesseur, Gemini 2.5 Flash. Les tests montrent que Gemini 3 Flash offre des performances comparables à celles des principaux modèles comme Gemini 3 Pro et GPT-5.2 d’OpenAI dans plusieurs domaines clés. Par exemple, lors du dernier examen de l’humanité (une vaste référence en matière de connaissances), Gemini 3 Flash a obtenu un score de 33,7 %, correspondant à GPT-5.2 à 34,5 % et dépassant Gemini 2.5 Flash à 11 %.
Plus impressionnant encore, Gemini 3 Flash est en tête du raisonnement multimodal, obtenant un score de 81,2 % au benchmark MMMU-Pro, surpassant tous les autres modèles testés. Ces résultats confirment la volonté agressive de Google de proposer une solution d’IA compétitive.
Déploiement grand public et entreprise
Google déploie immédiatement Gemini 3 Flash par défaut pour tous les utilisateurs de l’application Gemini, remplaçant l’ancien Gemini 2.5 Flash. Les utilisateurs qui ont besoin de capacités mathématiques ou de codage plus avancées peuvent toujours passer au modèle Pro via le sélecteur de modèle.
Les atouts du modèle incluent une compréhension multimodale améliorée, ce qui signifie qu’il peut traiter et répondre à des entrées combinées telles que des vidéos, des croquis et des enregistrements audio. Google souligne que cela permet des fonctionnalités telles que :
- Analyser des vidéos de pickleball pour obtenir des conseils.
- Deviner des croquis à partir de dessins d’utilisateurs.
- Génération de quiz à partir d’enregistrements audio.
Les utilisateurs d’entreprise, notamment JetBrains, Figma, Cursor, Harvey et Latitude, intègrent déjà Gemini 3 Flash via Vertex AI et Gemini Enterprise. Les développeurs peuvent accéder au modèle via l’API de Google et le nouvel outil de codage Antigravity.
Gains en matière de tarification et d’efficacité
Gemini 3 Flash est au prix de 0,50 $ pour 1 million de jetons d’entrée et de 3,00 $ pour 1 million de jetons de sortie – légèrement plus élevé que Gemini 2.5 Flash (0,30 $/2,50 $). Cependant, Google affirme que le nouveau modèle offre des vitesses trois fois plus rapides tout en surpassant le modèle 2.5 Pro.
De plus, Gemini 3 Flash utilise environ 30 % de jetons en moins pour de nombreuses tâches par rapport à l’ancien modèle, ce qui signifie que les utilisateurs peuvent potentiellement réduire les coûts malgré le taux par jeton légèrement plus élevé. Cela en fait une solution rentable pour les applications à volume élevé.
Le paysage concurrentiel
La sortie de Gemini 3 Flash intervient dans un contexte de concurrence accrue avec OpenAI. Les rapports indiquent qu’OpenAI a émis une alerte interne « Code Red » après la baisse du trafic ChatGPT suite aux récentes versions de l’IA de Google. OpenAI a répondu en publiant GPT-5.2 et un nouveau modèle de génération d’images, tout en mettant également l’accent sur son utilisation croissante en entreprise.
Google reconnaît la volonté d’innovation de l’ensemble du secteur et estime que la concurrence actuelle est un moteur de progrès. La société traite quotidiennement plus de 1 000 milliards de jetons via son API, ce qui témoigne de son engagement à maintenir une position de leader dans le développement de l’IA.
“Tous ces modèles continuent d’être géniaux, se défient les uns les autres, repoussent les limites”, déclare Tulsee Doshi, responsable des produits Google pour les modèles Gemini.
Le lancement de Gemini 3 Flash souligne l’intention de Google de rester un acteur majeur dans la course à l’IA, en offrant un mélange compétitif de performances, de vitesse et de rentabilité.
