Google heeft Gemini 3 Flash gelanceerd, een snellere en goedkopere versie van het onlangs uitgebrachte Gemini 3-model. Deze stap is ontworpen om rechtstreeks te concurreren met OpenAI en maakt Gemini 3 Flash onmiddellijk tot het standaardmodel in de Gemini-app en door AI aangedreven zoekfuncties. Deze ontwikkeling duidt op een escalatie in het snel evoluerende AI-landschap, waar snelheid, prestaties en kosten de belangrijkste onderscheidende factoren zijn.
Prestatiebenchmarks: Gemini 3 Flash versus concurrenten
Het nieuwe model vertoont aanzienlijke verbeteringen ten opzichte van zijn voorganger, Gemini 2.5 Flash. Uit tests blijkt dat Gemini 3 Flash op verschillende belangrijke gebieden prestaties levert die vergelijkbaar zijn met toonaangevende modellen zoals Gemini 3 Pro en OpenAI’s GPT-5.2. Op Humanity’s Last Exam (een brede kennisbenchmark) scoorde Gemini 3 Flash bijvoorbeeld 33,7%, wat overeenkomt met GPT-5.2 met 34,5% en Gemini 2.5 Flash overtreft met 11%.
Nog indrukwekkender is dat Gemini 3 Flash voorop loopt in multimodaal redeneren, met een score van 81,2% op de MMMU-Pro benchmark, waarmee hij beter presteert dan alle andere geteste modellen. Deze resultaten bevestigen de agressieve drang van Google naar een concurrerende AI-oplossing.
Uitrol voor consumenten en ondernemingen
Google implementeert Gemini 3 Flash onmiddellijk als standaard voor alle gebruikers in de Gemini-app, ter vervanging van de oudere Gemini 2.5 Flash. Gebruikers die meer geavanceerde wiskunde- of codeermogelijkheden nodig hebben, kunnen nog steeds via de modelkiezer overschakelen naar het Pro-model.
De sterke punten van het model zijn onder meer een verbeterd multimodaal begrip, wat betekent dat het gecombineerde input zoals video’s, schetsen en audio-opnamen kan verwerken en erop kan reageren. Google benadrukt dat dit functies mogelijk maakt zoals:
- Analyseren van pickleball-video’s voor tips.
- Schetsen raden op basis van gebruikerstekeningen.
- Het genereren van quizzen op basis van audio-opnamen.
Enterprise-gebruikers, waaronder JetBrains, Figma, Cursor, Harvey en Latitude, integreren Gemini 3 Flash al via Vertex AI en Gemini Enterprise. Ontwikkelaars hebben toegang tot het model via de API van Google en de nieuwe coderingstool Antigravity.
Prijs- en efficiëntiewinsten
Gemini 3 Flash kost $0,50 per 1 miljoen inputtokens en $3,00 per 1 miljoen outputtokens – iets hoger dan Gemini 2.5 Flash ($0,30/$2,50). Google beweert echter dat het nieuwe model drie keer hogere snelheden biedt en beter presteert dan het 2.5 Pro-model.
Bovendien gebruikt Gemini 3 Flash ongeveer 30% minder tokens voor veel taken vergeleken met het oudere model, wat betekent dat gebruikers mogelijk de kosten kunnen verlagen ondanks het iets hogere tarief per token. Dit maakt het een kosteneffectieve oplossing voor toepassingen met grote volumes.
Het concurrentielandschap
De release van Gemini 3 Flash komt te midden van verhoogde concurrentie met OpenAI. Uit rapporten blijkt dat OpenAI een interne ‘Code Red’-waarschuwing heeft afgegeven nadat het ChatGPT-verkeer was afgenomen als gevolg van de recente AI-releases van Google. OpenAI reageerde door GPT-5.2 en een nieuw model voor het genereren van afbeeldingen uit te brengen, terwijl ook de nadruk werd gelegd op het groeiende gebruik ervan in ondernemingen.
Google erkent de sectorbrede drang naar innovatie en is van mening dat de voortdurende concurrentie vooruitgang stimuleert. Het bedrijf verwerkt dagelijks meer dan 1 biljoen tokens via zijn API, wat aangeeft dat het zich inzet om een leidende positie in de AI-ontwikkeling te behouden.
“Al deze modellen blijven geweldig, dagen elkaar uit, verleggen de grenzen”, zegt Tulsee Doshi, Google’s hoofd Product voor Gemini Models.
De lancering van Gemini 3 Flash onderstreept de intentie van Google om een belangrijke speler te blijven in de AI-race en een competitieve mix van prestaties, snelheid en kostenefficiëntie te bieden.























