menu
close

Google erweitert KI-Kostenkontrolle auf Gemini 2.5 Pro

Google hat die Funktion der sogenannten „Denkkontingente“ von Gemini 2.5 Flash auf Gemini 2.5 Pro ausgeweitet und ermöglicht Entwicklern damit eine präzise Steuerung der Kosten für KI-gestützte Schlussfolgerungen. Nutzer können festlegen, wie viele Tokens ein Modell für das Denken verwendet, oder die Denkfunktion komplett deaktivieren, um ein Gleichgewicht zwischen Leistung und Wirtschaftlichkeit zu schaffen. Das Feature adressiert eine zentrale Herausforderung für Unternehmen, die fortschrittliche KI-Lösungen in großem Maßstab einsetzen, da die Kosten für komplexe Schlussfolgerungen in der Regel deutlich höher ausfallen.
Google erweitert KI-Kostenkontrolle auf Gemini 2.5 Pro

Google hat angekündigt, seine innovative Funktion der „Denkkontingente“ auf Gemini 2.5 Pro auszuweiten – das bislang fortschrittlichste KI-Modell des Unternehmens für komplexe Schlussfolgerungen. Zuvor war das Feature bereits Anfang des Jahres erfolgreich in Gemini 2.5 Flash eingeführt worden.

Die Denkkontingente stellen einen bedeutenden Fortschritt im Kostenmanagement von KI-Anwendungen dar: Entwickler können damit exakt steuern, wie viel Rechenleistung für die Bearbeitung komplexer Aufgaben aufgewendet wird. Nutzer können die maximale Anzahl an Tokens festlegen, die ein Modell für interne Denkprozesse vor der Antwortgenerierung verwendet – oder die Denkfunktion für einfachere Aufgaben komplett abschalten.

„Wir haben 2.5 Flash mit Denkkontingenten eingeführt, um Entwicklern mehr Kontrolle über die Kosten zu geben, indem sie Latenz und Qualität ausbalancieren. Und wir erweitern diese Möglichkeit jetzt auf 2.5 Pro“, erklärte Google in der Ankündigung. Das Unternehmen bestätigte, dass Gemini 2.5 Pro mit Denkkontingenten in den kommenden Wochen allgemein für den stabilen Produktionseinsatz verfügbar sein wird.

Diese Entwicklung adressiert eine grundlegende Herausforderung auf dem heutigen KI-Markt: Je ausgefeilter die Schlussfolgerungen, desto höher sind in der Regel sowohl Latenz als auch Kosten. Bei Gemini 2.5 Flash etwa steigen die Ausgabekosten durch Aktivierung der Denkfunktion fast um das Sechsfache – von 0,60 auf 3,50 US-Dollar pro eine Million Tokens. Mithilfe der Denkkontingente können Unternehmen ihre KI-Anwendungen gezielt optimieren und die Denkfunktion nur dann aktivieren, wenn sie tatsächlich benötigt wird.

Gerade für Unternehmenskunden, die KI-Kosten genau steuern und dennoch fortschrittliche Funktionen nutzen möchten, ist das Feature besonders wertvoll. Bei einfachen Aufgaben wie Übersetzungen oder der Beantwortung grundlegender Informationsanfragen kann das Denken für maximale Kosteneffizienz deaktiviert werden. Für komplexe Aufgaben, die mehrstufige Schlussfolgerungen erfordern – etwa mathematische Problemlösungen oder differenzierte Analysen – lässt sich die Denkfunktion gezielt aktivieren und feinjustieren.

Da KI-Lösungen zunehmend in Geschäftsprozesse integriert werden, zeigt Googles Ansatz mit individuell anpassbaren Denkprozessen, dass der Markt reifer wird: Kostenoptimierung und Feintuning der Leistung werden ebenso wichtig wie die reinen Fähigkeiten der Modelle – ein Signal für eine neue Phase in der Kommerzialisierung generativer KI-Technologien.

Source:

Latest News