Google lansează Gemini 2.5 Flash cu capabilități avansate de raționament

Google a lansat Gemini 2.5 Flash în regim de previzualizare, aducând îmbunătățiri semnificative modelului său AI rapid și eficient din punct de vedere al costurilor. Această nouă versiune introduce capabilități hibride de raționament care permit dezvoltatorilor să controleze procesul de gândire al modelului, menținând în același timp viteza și eficiența. Previzualizarea este disponibilă acum în Google AI Studio, Vertex AI și aplicația Gemini, urmând ca disponibilitatea generală să fie programată pentru începutul lunii iunie 2025.

Google a lansat o versiune de previzualizare a Gemini 2.5 Flash, cea mai nouă iterație a modelului său AI eficient, conceput pentru a echilibra performanța cu viteza și rentabilitatea.

Bazându-se pe fundația pusă de Gemini 2.0 Flash, noul model 2.5 Flash aduce un upgrade major la nivelul capabilităților de raționament, menținându-și totodată reputația pentru eficiență. Google îl descrie drept „un upgrade major la nivelul capabilităților de raționament, continuând să prioritizeze viteza și costul”.

Caracteristica definitorie a Gemini 2.5 Flash este sistemul său de raționament hibrid. Este „primul model Google cu raționament complet hibrid, care permite dezvoltatorilor să activeze sau să dezactiveze gândirea și să seteze bugete de gândire pentru a optimiza echilibrul dintre calitate, cost și latență”. Această abordare inovatoare oferă dezvoltatorilor un control fără precedent asupra modului în care modelul procesează sarcinile complexe.

În practică, acest lucru înseamnă că dezvoltatorii pot specifica un „buget de gândire” care controlează cât de mult raționament realizează modelul. Aceștia pot ajusta „numărul de tokeni pe care modelul îi poate genera în timp ce gândește”, de la 0 la 24.576 tokeni, folosind un slider în Google AI Studio și Vertex AI sau printr-un parametru API. Când bugetul de gândire este setat la zero, modelul are același cost și aceeași latență ca Gemini 2.0 Flash.

Structura de preț reflectă această flexibilitate: tokenii de input costă 15 cenți pe milion, iar cei de output 60 de cenți pe milion fără raționament. Cu funcția de gândire activată, costul crește la 3,50 dolari pe milion de tokeni.

Testele de referință arată rezultate impresionante. Gemini 2.5 Flash „are performanțe excelente la Hard Prompts în LMArena, fiind depășit doar de 2.5 Pro” și „are metrici comparabile cu alte modele de top, la o fracțiune din cost și dimensiune”, continuând „să conducă drept modelul cu cel mai bun raport preț-performanță”.

Google descrie 2.5 Flash drept „cel mai eficient model de lucru, conceput pentru viteză și cost redus”, menționând că a „înregistrat îmbunătățiri la nivelul principalelor benchmark-uri pentru raționament, multimodalitate, cod și context extins, devenind și mai eficient, folosind cu 20-30% mai puțini tokeni” în evaluări.

Noul model este disponibil momentan în regim de previzualizare prin mai multe canale. Este lansat „în Google AI Studio (pentru dezvoltatori), Vertex AI (pentru companii) și aplicația Gemini (pentru toți utilizatorii)”. Potrivit anunțurilor Google de la I/O 2025, versiunea actualizată va fi „disponibilă general în Google AI Studio pentru dezvoltatori și în Vertex AI pentru companii la începutul lunii iunie”, urmând ca Gemini 2.5 Pro să fie lansat „la scurt timp după”.

Pe măsură ce Google continuă să-și extindă capabilitățile AI, Gemini 2.5 Flash reprezintă un pas important înainte în direcția accesibilizării și eficientizării raționamentului avansat atât pentru dezvoltatori, cât și pentru utilizatori.

Source:

Google lansează Gemini 2.5 Flash cu capabilități avansate de raționament

Latest News

Doubao AI de la ByteDance Oferă Acum Asistență Video în Timp Real

OnePlus renunță la Alert Slider în favoarea butonului Plus Key alimentat de AI

Giganții tehnologici germani se unesc pentru o gigafabrică de inteligență artificială susținută de UE

Procurorii americani au investigat Builder.ai înainte ca startup-ul AI de 1,5 miliarde de dolari să se prăbușească

Fondul de 1,8 trilioane de dolari al Norvegiei face din inteligența artificială o cerință obligatorie pentru angajați

OpenTools.ai lansează un hub de știri AI pentru profesioniștii din tehnologie

Google extinde controlul AI asupra computerului pentru dezvoltatori prin Gemini

Google îmbunătățește modelele Gemini cu rezumate transparente ale procesului de gândire

Google lansează Gemini 2.5 Flash cu capabilități avansate de raționament

Related Articles

Doubao AI de la ByteDance Oferă Acum Asistență Video în Timp Real

OpenTools.ai lansează un hub de știri AI pentru profesioniștii din tehnologie

Google extinde controlul AI asupra computerului pentru dezvoltatori prin Gemini

Google îmbunătățește modelele Gemini cu rezumate transparente ale procesului de gândire

Google extinde controlul costurilor AI la Gemini 2.5 Pro

Latest News

Doubao AI de la ByteDance Oferă Acum Asistență Video în Timp Real

OnePlus renunță la Alert Slider în favoarea butonului Plus Key alimentat de AI

Giganții tehnologici germani se unesc pentru o gigafabrică de inteligență artificială susținută de UE

Procurorii americani au investigat Builder.ai înainte ca startup-ul AI de 1,5 miliarde de dolari să se prăbușească

Fondul de 1,8 trilioane de dolari al Norvegiei face din inteligența artificială o cerință obligatorie pentru angajați

OpenTools.ai lansează un hub de știri AI pentru profesioniștii din tehnologie

Google extinde controlul AI asupra computerului pentru dezvoltatori prin Gemini

Google îmbunătățește modelele Gemini cu rezumate transparente ale procesului de gândire