Google erweitert Gemini 2.5-Familie um ultra-effizientes Flash-Lite

Google hat seine Gemini 2.5-Familie erweitert: Gemini 2.5 Flash und Pro sind ab sofort allgemein verfügbar, während 2.5 Flash-Lite als Vorschau eingeführt wird – das bislang kosteneffizienteste und schnellste 2.5-Modell. Flash-Lite ist ein auf Kosten und Geschwindigkeit optimiertes Reasoning-Modell, bei dem "Denken" standardmäßig deaktiviert ist. Es bietet eine noch günstigere Option für latenzkritische Anwendungsfälle, die weniger Modellintelligenz erfordern. Gleichzeitig ist Gemini 2.5 Pro zum weltweit führenden Modell auf den WebDev Arena- und LMArena-Bestenlisten aufgestiegen, was Googles kontinuierlichen Fortschritt im Bereich KI unterstreicht.

Google hat bekannt gegeben, dass Gemini 2.5 Flash und 2.5 Pro nun stabil und allgemein verfügbar sind. Damit erhalten Unternehmen die Zuverlässigkeit und Skalierbarkeit, die sie benötigen, um fortschrittliche KI-Funktionen mit Vertrauen in geschäftskritische Anwendungen zu integrieren. Parallel dazu stellt das Unternehmen Gemini 2.5 Flash-Lite als Vorschau vor – das bislang kosteneffizienteste und schnellste Modell der 2.5-Reihe.

Gemini 2.5 Flash-Lite ist ein Reasoning-Modell, das eine dynamische Steuerung des "Denkbudgets" über einen API-Parameter ermöglicht. Im Gegensatz zu anderen Modellen der 2.5-Familie ist Flash-Lite auf Kosten und Geschwindigkeit optimiert und hat "Denken" standardmäßig deaktiviert. Trotz dieser Optimierungen unterstützt es alle nativen Tools, darunter Grounding mit Google Search, Codeausführung und URL-Kontext sowie Funktionsaufrufe.

Flash-Lite bietet eine höhere Leistung als das vorherige Flash-Lite-Modell und ist 1,5-mal schneller als 2.0 Flash – bei geringeren Kosten. Es ist speziell für Aufgaben mit hohem Volumen und niedriger Latenz wie Übersetzung, Klassifizierung, intelligentes Routing und andere kostenkritische, großskalige Anwendungen konzipiert. Das Modell erzielt deutlich bessere Ergebnisse als 2.0 Flash-Lite bei Benchmarks zu Programmierung, Mathematik, Wissenschaft, Reasoning und multimodalen Aufgaben und eignet sich damit ideal für Aufgaben mit hohem Durchsatz.

Wie andere Modelle der Gemini 2.5-Familie verfügt Flash-Lite über hilfreiche Funktionen, darunter die Möglichkeit, das "Denken" mit unterschiedlichen Budgets zu aktivieren, die Anbindung an Tools wie Grounding mit Google Search und Codeausführung, multimodale Eingaben sowie einen Kontextumfang von einer Million Tokens. Um aktuelle und faktisch korrekte Antworten zu gewährleisten, kann Flash-Lite Google Search als integriertes Tool nutzen und intelligent entscheiden, wann die Suche zur Wissensanreicherung eingesetzt wird.

Über die Einführung von Flash-Lite hinaus hat Google bekannt gegeben, dass Gemini 2.5 Pro zum weltweit führenden Modell auf den Bestenlisten von WebDev Arena und LMArena aufgestiegen ist. Mit einem ELO-Score von 1415 auf der WebDev Arena Coding-Bestenliste führt es alle Leaderboards in LMArena an, die menschliche Präferenzen in mehreren Dimensionen misst. Darüber hinaus hat Google LearnLM direkt in Gemini 2.5 integriert und macht es damit zum weltweit führenden Modell für Lernen. Laut dem jüngsten Bericht von Google übertraf Gemini 2.5 Pro die Konkurrenz in jeder Kategorie der Lernwissenschaften; Lehrkräfte und Pädagogik-Expert:innen bevorzugten es in einer Vielzahl von Lernszenarien gegenüber anderen Angeboten.

Gemini 2.5 Flash-Lite ist ab sofort als Vorschau in Google AI Studio und Vertex AI verfügbar, zusammen mit den stabilen Versionen von 2.5 Flash und Pro. Entwickler:innen können auf das Modell (gemini-2.5-flash-lite-preview-06-17) über das Google Gen AI SDK zugreifen, das eine einheitliche Schnittstelle zur Gemini 2.5-Modellfamilie über die Gemini Developer API und die Vertex AI Gemini API bietet.

Source:

Google erweitert Gemini 2.5-Familie um ultra-effizientes Flash-Lite

Latest News

BrightAI sichert sich 51 Millionen US-Dollar zur Transformation kritischer Infrastrukturen mit KI

Firestorm sichert sich 47 Millionen US-Dollar zur Revolutionierung der KI-gestützten Drohnenfertigung

Startup schützt KI-Daten mit Verschlüsselungsdurchbruch

Unify sichert sich 40 Mio. US-Dollar zur Transformation des Vertriebs mit KI-gestützten Intent-Signalen

Cybersecurity-Veteran startet KI-gestützten Schutz gegen gezielte Angriffe

DeepMinds KI entschlüsselt das 'dunkle Material' der DNA und revolutioniert die Krebsforschung

Amazon stellt Kiro vor: KI-gestützte IDE revolutioniert Softwareentwicklung

KI-Durchbruch reduziert CO2-Fußabdruck von Zement drastisch

Neue Roboterhaut verleiht Maschinen menschliche Tastsinn-Wahrnehmung

OpenAI vereint KI-Tools mit ChatGPT Agent für autonome Aufgaben

Google erweitert Gemini 2.5-Familie um ultra-effizientes Flash-Lite

Related Articles

Amazon stellt Kiro vor: KI-gestützte IDE revolutioniert Softwareentwicklung

OpenAI vereint KI-Tools mit ChatGPT Agent für autonome Aufgaben

S&P Global stellt KI-bereite Metadaten zur Transformation der Finanzanalyse vor

Muratis Thinking Machines Lab sichert sich 2 Milliarden US-Dollar für KI-Revolution

Googles KI übernimmt jetzt Telefonate für Sie

Latest News

BrightAI sichert sich 51 Millionen US-Dollar zur Transformation kritischer Infrastrukturen mit KI

Firestorm sichert sich 47 Millionen US-Dollar zur Revolutionierung der KI-gestützten Drohnenfertigung

Startup schützt KI-Daten mit Verschlüsselungsdurchbruch

Unify sichert sich 40 Mio. US-Dollar zur Transformation des Vertriebs mit KI-gestützten Intent-Signalen

Cybersecurity-Veteran startet KI-gestützten Schutz gegen gezielte Angriffe

DeepMinds KI entschlüsselt das 'dunkle Material' der DNA und revolutioniert die Krebsforschung

Amazon stellt Kiro vor: KI-gestützte IDE revolutioniert Softwareentwicklung

KI-Durchbruch reduziert CO2-Fußabdruck von Zement drastisch

Neue Roboterhaut verleiht Maschinen menschliche Tastsinn-Wahrnehmung

OpenAI vereint KI-Tools mit ChatGPT Agent für autonome Aufgaben