Google a lansat o versiune de previzualizare a Gemini 2.5 Flash, cea mai nouă iterație a modelului său AI eficient, conceput pentru a echilibra performanța cu viteza și rentabilitatea.
Bazându-se pe fundația pusă de Gemini 2.0 Flash, noul model 2.5 Flash aduce un upgrade major la nivelul capabilităților de raționament, menținându-și totodată reputația pentru eficiență. Google îl descrie drept „un upgrade major la nivelul capabilităților de raționament, continuând să prioritizeze viteza și costul”.
Caracteristica definitorie a Gemini 2.5 Flash este sistemul său de raționament hibrid. Este „primul model Google cu raționament complet hibrid, care permite dezvoltatorilor să activeze sau să dezactiveze gândirea și să seteze bugete de gândire pentru a optimiza echilibrul dintre calitate, cost și latență”. Această abordare inovatoare oferă dezvoltatorilor un control fără precedent asupra modului în care modelul procesează sarcinile complexe.
În practică, acest lucru înseamnă că dezvoltatorii pot specifica un „buget de gândire” care controlează cât de mult raționament realizează modelul. Aceștia pot ajusta „numărul de tokeni pe care modelul îi poate genera în timp ce gândește”, de la 0 la 24.576 tokeni, folosind un slider în Google AI Studio și Vertex AI sau printr-un parametru API. Când bugetul de gândire este setat la zero, modelul are același cost și aceeași latență ca Gemini 2.0 Flash.
Structura de preț reflectă această flexibilitate: tokenii de input costă 15 cenți pe milion, iar cei de output 60 de cenți pe milion fără raționament. Cu funcția de gândire activată, costul crește la 3,50 dolari pe milion de tokeni.
Testele de referință arată rezultate impresionante. Gemini 2.5 Flash „are performanțe excelente la Hard Prompts în LMArena, fiind depășit doar de 2.5 Pro” și „are metrici comparabile cu alte modele de top, la o fracțiune din cost și dimensiune”, continuând „să conducă drept modelul cu cel mai bun raport preț-performanță”.
Google descrie 2.5 Flash drept „cel mai eficient model de lucru, conceput pentru viteză și cost redus”, menționând că a „înregistrat îmbunătățiri la nivelul principalelor benchmark-uri pentru raționament, multimodalitate, cod și context extins, devenind și mai eficient, folosind cu 20-30% mai puțini tokeni” în evaluări.
Noul model este disponibil momentan în regim de previzualizare prin mai multe canale. Este lansat „în Google AI Studio (pentru dezvoltatori), Vertex AI (pentru companii) și aplicația Gemini (pentru toți utilizatorii)”. Potrivit anunțurilor Google de la I/O 2025, versiunea actualizată va fi „disponibilă general în Google AI Studio pentru dezvoltatori și în Vertex AI pentru companii la începutul lunii iunie”, urmând ca Gemini 2.5 Pro să fie lansat „la scurt timp după”.
Pe măsură ce Google continuă să-și extindă capabilitățile AI, Gemini 2.5 Flash reprezintă un pas important înainte în direcția accesibilizării și eficientizării raționamentului avansat atât pentru dezvoltatori, cât și pentru utilizatori.