menu
close

Google esittelee Imagen 4:n ja laajentaa Gemini 2.5 -mallistoa

Google on julkaissut Imagen 4:n, edistyneimmän tekstistä kuvaksi -mallinsa, joka on nyt saatavilla maksullisessa esikatselussa Gemini API:n ja Google AI Studion kautta. Julkaisu ajoittuu samaan aikaan Gemini 2.5 Flash- ja Pro-mallien yleisen saatavuuden kanssa sekä uuden Gemini 2.5 Flash-Lite -mallin esittelyn kanssa, joka on Googlen kustannustehokkain ja nopein 2.5-perheen malli. Kehittäjät voivat nyt käyttää Geminia myös suoraan komentoriviltä uuden avoimen lähdekoodin Gemini CLI:n avulla.
Google esittelee Imagen 4:n ja laajentaa Gemini 2.5 -mallistoa

Google on laajentanut tekoälykyvykkyyksiään merkittävästi julkaisemalla Imagen 4:n, edistyneimmän tekstistä kuvaksi -generointimallinsa, joka on nyt saatavilla maksullisessa esikatselussa Gemini API:n ja Google AI Studion kautta.

Imagen 4 tarjoaa huomattavia parannuksia aiempiin versioihin verrattuna, erityisesti tekstin laadussa generoituissa kuvissa. Julkaisu sisältää kaksi malliversiota: perus Imagen 4 -mallin, jonka hinta on 0,04 dollaria per luotu kuva, sekä Imagen 4 Ultra -mallin, jonka hinta on 0,06 dollaria per kuva ja joka tarjoaa entistä tarkemman käyttäjäohjeiden noudattamisen. Molemmissa malleissa on SynthID-vesileimausteknologia, joka on näkymätön ihmiselle, mutta auttaa tunnistamaan tekoälyn tuottaman sisällön.

Tämä julkaisu on osa Googlen laajempaa Gemini 2.5 -malliperheen laajennusta. Yhtiö on tuonut Gemini 2.5 Flash- ja Pro-mallit yleisesti saataville onnistuneiden esikatselujaksojen jälkeen, ja samalla esitellyt Gemini 2.5 Flash-Lite -mallin esikatseluun. Flash-Lite on Googlen kustannustehokkain ja nopein 2.5-malli, joka on optimoitu suurivolyymisiin ja viiveherkkiin tehtäviin, kuten luokitteluun, käännöksiin ja älykkääseen reititykseen.

Tehokkuuteen keskittymisestä huolimatta Gemini 2.5 Flash-Lite säilyttää 2.5-perheen keskeiset ominaisuudet, kuten miljoonan tokenin kontekstikkunan sekä tuen natiivityökaluille, kuten Google-haun integroinnille ja koodin suorittamiselle. Toisin kuin perheen muissa malleissa, joissa "ajattelu"-ominaisuudet ovat oletuksena päällä, Flash-Lite mahdollistaa kehittäjille ajattelubudjettien hallinnan API-parametrien avulla, ja ajattelu on oletuksena pois päältä nopeuden ja kustannustehokkuuden optimoimiseksi.

Kehittäjätyökalujaan vahvistaakseen Google on julkaissut Gemini CLI:n, avoimen lähdekoodin tekoälyagentin, joka tuo Geminin suoraan komentoriville. Tämän työkalun avulla kehittäjät voivat käyttää Gemini 2.5 Pro -mallia komentorivikäyttöliittymän kautta koodaukseen, ongelmanratkaisuun ja tehtävien hallintaan. Gemini CLI:n avoin lähdekoodi (Apache 2.0 -lisenssillä) mahdollistaa kehittäjille koodin tarkastelun, tietoturvan varmistamisen ja osallistumisen työkalun kehitykseen.

Googlen uusimmat tekoälyjulkaisut osoittavat yhtiön sitoutumisen tarjota kehittäjille yhä tehokkaampia ja joustavampia työkaluja eri hintaluokissa ja käyttötapauksissa, aina korkealaatuisesta kuvageneroinnista tehokkaaseen tekstinkäsittelyyn ja komentorivipohjaiseen tekoälyavustamiseen.

Source:

Latest News