Google on virallisesti julkaissut Gemini 2.5 Flash-Liten, mikä merkitsee merkittävää edistysaskelta tehokkaan tekoälyn tuomisessa entistä saavutettavammaksi ja energiatehokkaammaksi kehittäjille ja yrityksille.
Uusi malli, jota Google kuvaa "kustannustehokkaimmaksi ja nopeimmaksi 2.5-malliksi tähän mennessä", on optimoitu suurivolyymisiin ja viiveherkkiin operaatioihin. Flash-Lite tulee markkinoille koko 2.5-malliperheen matalimmalla viiveellä ja kustannuksilla, tarjoten kustannustehokkaan päivityksen aiempiin 1.5- ja 2.0 Flash -malleihin verrattuna. Se tarjoaa paremman suorituskyvyn useimmissa arvioinneissa, lyhyemmän ajan ensimmäiseen tokeniin sekä korkeamman tokenien dekoodausnopeuden sekunnissa, tehden siitä ihanteellisen suurivolyymisiin tehtäviin kuten luokitteluun tai laajamittaiseen tiivistämiseen.
Päättelymallina Flash-Lite mahdollistaa ajattelubudjetin dynaamisen hallinnan API-parametrin avulla. Toisin kuin muissa Gemini 2.5 -malleissa, joissa ajattelu on oletuksena päällä, Flash-Lite optimoi kustannuksia ja nopeutta pitämällä ajattelun pois päältä, ellei sitä erikseen aktivoida. Tästä optimoinnista huolimatta se tukee kaikkia natiivityökaluja, mukaan lukien Google-haun ankkurointi, koodin suoritus, URL-konteksti ja funktiokutsut.
Suorituskykytestit osoittavat, että Flash-Lite on 1,5 kertaa nopeampi kuin Gemini 2.0 Flash ja samalla edullisempi, mikä tekee siitä erityisen sopivan tehtäviin kuten luokittelu, käännös, älykäs reititys sekä muihin kustannusherkkiin ja laajamittaisiin operaatioihin. Siinä missä muut mallit saattavat oletuksena hyödyntää tehokkaampia (ja kalliimpia) päättelytyökaluja vastausten tuottamiseen, Flash-Lite antaa kehittäjille hallinnan tähän prosessiin. Käyttäjät voivat kytkeä ajattelukyvyn päälle tai pois tarpeidensa mukaan, eikä Flash-Liten kustannustehokkuus rajoita sen suorituskykyä.
Gemini 2.5 Flash-Liten esiversio on nyt saatavilla Google AI Studiossa ja Vertex AI:ssa yhdessä 2.5 Flashin ja Pron vakaiden versioiden kanssa. Sekä 2.5 Flash että Pro ovat myös käytettävissä Gemini-sovelluksessa, ja Google on tuonut räätälöidyt versiot 2.5 Flash-Litesta ja Flashista myös hakuun.
Tämä strateginen laajennus Gemini-malliperheessä kuvastaa Googlen sitoutumista tekoälyn demokratisointiin tarjoamalla vaihtoehtoja, jotka tasapainottavat suorituskykyä, kustannuksia ja nopeutta erilaisiin käyttötarkoituksiin – aina monimutkaisista päättelytehtävistä suurivolyymiseen datankäsittelyyn.