Google on laajentanut tekoälykyvykkyyksiään merkittävästi julkaisemalla Imagen 4:n, edistyneimmän tekstistä kuvaksi -generointimallinsa, joka on nyt saatavilla maksullisessa esikatselussa Gemini API:n ja Google AI Studion kautta.
Imagen 4 tarjoaa huomattavia parannuksia aiempiin versioihin verrattuna, erityisesti tekstin laadussa generoituissa kuvissa. Julkaisu sisältää kaksi malliversiota: perus Imagen 4 -mallin, jonka hinta on 0,04 dollaria per luotu kuva, sekä Imagen 4 Ultra -mallin, jonka hinta on 0,06 dollaria per kuva ja joka tarjoaa entistä tarkemman käyttäjäohjeiden noudattamisen. Molemmissa malleissa on SynthID-vesileimausteknologia, joka on näkymätön ihmiselle, mutta auttaa tunnistamaan tekoälyn tuottaman sisällön.
Tämä julkaisu on osa Googlen laajempaa Gemini 2.5 -malliperheen laajennusta. Yhtiö on tuonut Gemini 2.5 Flash- ja Pro-mallit yleisesti saataville onnistuneiden esikatselujaksojen jälkeen, ja samalla esitellyt Gemini 2.5 Flash-Lite -mallin esikatseluun. Flash-Lite on Googlen kustannustehokkain ja nopein 2.5-malli, joka on optimoitu suurivolyymisiin ja viiveherkkiin tehtäviin, kuten luokitteluun, käännöksiin ja älykkääseen reititykseen.
Tehokkuuteen keskittymisestä huolimatta Gemini 2.5 Flash-Lite säilyttää 2.5-perheen keskeiset ominaisuudet, kuten miljoonan tokenin kontekstikkunan sekä tuen natiivityökaluille, kuten Google-haun integroinnille ja koodin suorittamiselle. Toisin kuin perheen muissa malleissa, joissa "ajattelu"-ominaisuudet ovat oletuksena päällä, Flash-Lite mahdollistaa kehittäjille ajattelubudjettien hallinnan API-parametrien avulla, ja ajattelu on oletuksena pois päältä nopeuden ja kustannustehokkuuden optimoimiseksi.
Kehittäjätyökalujaan vahvistaakseen Google on julkaissut Gemini CLI:n, avoimen lähdekoodin tekoälyagentin, joka tuo Geminin suoraan komentoriville. Tämän työkalun avulla kehittäjät voivat käyttää Gemini 2.5 Pro -mallia komentorivikäyttöliittymän kautta koodaukseen, ongelmanratkaisuun ja tehtävien hallintaan. Gemini CLI:n avoin lähdekoodi (Apache 2.0 -lisenssillä) mahdollistaa kehittäjille koodin tarkastelun, tietoturvan varmistamisen ja osallistumisen työkalun kehitykseen.
Googlen uusimmat tekoälyjulkaisut osoittavat yhtiön sitoutumisen tarjota kehittäjille yhä tehokkaampia ja joustavampia työkaluja eri hintaluokissa ja käyttötapauksissa, aina korkealaatuisesta kuvageneroinnista tehokkaaseen tekstinkäsittelyyn ja komentorivipohjaiseen tekoälyavustamiseen.