Google hat Gemini 3 Flash auf den Markt gebracht, eine schnellere und günstigere Version seines kürzlich veröffentlichten Gemini 3-Modells. Der Schritt soll direkt mit OpenAI konkurrieren und macht Gemini 3 Flash sofort zum Standardmodell in der Gemini-App und den KI-gestützten Suchfunktionen. Diese Entwicklung signalisiert eine Eskalation in der sich schnell entwickelnden KI-Landschaft, in der Geschwindigkeit, Leistung und Kosten wesentliche Unterscheidungsmerkmale sind.
Leistungsbenchmarks: Gemini 3 Flash im Vergleich zu Mitbewerbern
Das neue Modell weist deutliche Verbesserungen gegenüber seinem Vorgänger Gemini 2.5 Flash auf. Tests zeigen, dass Gemini 3 Flash in mehreren Schlüsselbereichen eine Leistung liefert, die mit führenden Modellen wie Gemini 3 Pro und OpenAIs GPT-5.2 vergleichbar ist. Beispielsweise erzielte Gemini 3 Flash beim Humanity’s Last Exam (einem umfassenden Wissens-Benchmark) eine Punktzahl von 33,7 %, erreichte GPT-5.2 mit 34,5 % und übertraf Gemini 2.5 Flash mit 11 %.
Noch beeindruckender ist, dass Gemini 3 Flash beim multimodalen Denken führend ist und einen 81,2 %-Wert im MMMU-Pro-Benchmark erreicht und damit alle anderen getesteten Modelle übertrifft. Diese Ergebnisse bestätigen den aggressiven Vorstoß von Google für eine wettbewerbsfähige KI-Lösung.
Einführung für Verbraucher und Unternehmen
Google stellt ab sofort Gemini 3 Flash als Standard für alle Nutzer der Gemini-App bereit und ersetzt damit das ältere Gemini 2.5 Flash. Benutzer, die fortgeschrittenere Mathematik- oder Codierungsfunktionen benötigen, können über die Modellauswahl weiterhin zum Pro-Modell wechseln.
Zu den Stärken des Modells gehört ein verbessertes multimodales Verständnis, das heißt, es kann kombinierte Eingaben wie Videos, Skizzen und Audioaufnahmen verarbeiten und darauf reagieren. Google betont, dass dies Funktionen wie die folgenden ermöglicht:
- Pickleball-Videos analysieren, um Tipps zu erhalten.
- Erraten von Skizzen anhand von Benutzerzeichnungen.
- Generieren von Quizfragen aus Audioaufnahmen.
Unternehmensbenutzer, darunter JetBrains, Figma, Cursor, Harvey und Latitude, integrieren Gemini 3 Flash bereits über Vertex AI und Gemini Enterprise. Entwickler können über die Google-API und das neue Antigravity-Codierungstool auf das Modell zugreifen.
Preis- und Effizienzgewinne
Der Preis für Gemini 3 Flash liegt bei 0,50 $ pro 1 Million Input-Tokens und 3,00 $ pro 1 Million Output-Tokens – etwas höher als für Gemini 2.5 Flash (0,30 $/2,50 $). Google behauptet jedoch, dass das neue Modell dreimal schnellere Geschwindigkeiten bietet und dabei die Leistung des 2.5 Pro-Modells übertrifft.
Darüber hinaus verbraucht Gemini 3 Flash im Vergleich zum älteren Modell etwa 30 % weniger Token für viele Aufgaben, was bedeutet, dass Benutzer trotz der etwas höheren Rate pro Token möglicherweise die Kosten senken können. Dies macht es zu einer kostengünstigen Lösung für Anwendungen mit hohem Volumen.
Die Wettbewerbslandschaft
Die Veröffentlichung von Gemini 3 Flash erfolgt inmitten eines verschärften Wettbewerbs mit OpenAI. Berichten zufolge hat OpenAI eine interne „Code Red“-Warnung ausgegeben, nachdem der ChatGPT-Verkehr nach den jüngsten KI-Veröffentlichungen von Google zurückgegangen war. OpenAI reagierte mit der Veröffentlichung von GPT-5.2 und einem neuen Bildgenerierungsmodell und betonte gleichzeitig die wachsende Nutzung in Unternehmen.
Google erkennt den branchenweiten Innovationsdrang an und ist davon überzeugt, dass der anhaltende Wettbewerb den Fortschritt vorantreibt. Das Unternehmen verarbeitet täglich über 1 Billion Token über seine API und unterstreicht damit sein Engagement, eine führende Position in der KI-Entwicklung zu behaupten.
„Alle diese Modelle sind weiterhin großartig, fordern sich gegenseitig heraus und verschieben die Grenzen“, sagt Tulsee Doshi, Googles Produktleiterin für Gemini Models.
Die Einführung von Gemini 3 Flash unterstreicht Googles Absicht, ein wichtiger Akteur im KI-Wettbewerb zu bleiben und eine wettbewerbsfähige Mischung aus Leistung, Geschwindigkeit und Kosteneffizienz zu bieten.























