Google on julkaissut Gemini 2.5 Flashin esikatseluversion, joka on yhtiön tehokkaan tekoälymallin uusin kehitysversio ja tasapainottaa suorituskykyä, nopeutta ja kustannustehokkuutta.
Rakentaen Gemini 2.0 Flashin pohjalle uusi 2.5 Flash -malli tarjoaa merkittävän päivityksen päättelykykyihin samalla, kun se säilyttää tehokkuutensa. Google kuvaa sitä "merkittäväksi päivitykseksi päättelykyvyissä, kuitenkin edelleen painottaen nopeutta ja kustannuksia."
Gemini 2.5 Flashin erottuva ominaisuus on sen hybridipäättelyjärjestelmä. Kyseessä on Googlen "ensimmäinen täysin hybridipäättelymalli, jonka avulla kehittäjät voivat kytkeä ajattelun päälle tai pois ja asettaa ajattelubudjetin optimoidakseen laadun, kustannusten ja viiveen tasapainoa." Tämä innovatiivinen lähestymistapa antaa kehittäjille ennennäkemättömän hallinnan siihen, miten malli käsittelee monimutkaisia tehtäviä.
Käytännössä tämä tarkoittaa, että kehittäjät voivat määrittää "ajattelubudjetin", joka ohjaa kuinka paljon päättelyä malli suorittaa. He voivat säätää "kuinka monta tokenia malli voi käyttää ajatteluun" välillä 0–24 576 tokenia Google AI Studiossa ja Vertex AI:ssa liukusäätimellä tai API-parametrilla. Kun ajattelubudjetti on nolla, malli vastaa Gemini 2.0 Flashin kustannuksia ja viivettä.
Hinnoittelu heijastaa tätä joustavuutta: syötetokenit maksavat 15 senttiä miljoonalta ja tulostokenit 60 senttiä miljoonalta ilman päättelyä. Kun ajattelukyky aktivoidaan, hinta nousee 3,50 dollariin miljoonalta tokenilta.
Vertailutestit osoittavat vaikuttavia tuloksia. Gemini 2.5 Flash "suoriutuu erinomaisesti LMArenan vaativissa tehtävissä, jääden vain 2.5 Pro:n taakse" ja "sen mittarit ovat verrattavissa muihin johtaviin malleihin murto-osalla kustannuksista ja koosta", ja se "jatkaa johtamista parhaalla hinta-laatusuhteella."
Google kuvaa 2.5 Flashia "tehokkaimmaksi työjuhdamallikseen, joka on suunniteltu nopeuteen ja edullisuuteen", ja toteaa sen "parantuneen keskeisissä päättely-, multimodaalisuus-, koodi- ja pitkän kontekstin vertailuissa ollen entistä tehokkaampi, käyttäen arvioissa 20–30 % vähemmän tokeneita."
Uusi malli on tällä hetkellä saatavilla esikatselutilassa useiden kanavien kautta. Se otetaan käyttöön "Google AI Studiossa (kehittäjille), Vertex AI:ssa (yrityksille) ja Gemini-sovelluksessa (kaikille)." Googlen I/O 2025 -tapahtuman mukaan päivitetty versio tulee "yleisesti saataville Google AI Studioon kehittäjille ja Vertex AI:hin yrityksille kesäkuun alussa", ja Gemini 2.5 Pro seuraa "pian tämän jälkeen."
Googlen jatkaessa tekoälykykyjensä laajentamista Gemini 2.5 Flash edustaa merkittävää askelta kohti edistyneen päättelyn tuomista kehittäjien ja käyttäjien ulottuville entistä kustannustehokkaammin.