menu
close

Googlen Gemini Diffusion mullistaa tekoälytekstin generoinnin

Google on esitellyt Gemini Diffusionin, uraauurtavan tekstin generointimallin, joka muuntaa satunnaisen kohinan johdonmukaiseksi tekstiksi jopa viisi kertaa aiempia malleja nopeammin. Kokeellinen malli hyödyntää diffuusioteknologiaa – samankaltaista kuin kuvien generoinnissa – tuottaen jopa 2 000 tokenia sekunnissa ja yltäen samalla nykyisten mallien koodauskykyyn. Google on myös parantanut Gemini 2.5 -mallistoaan ajattelubudjeteilla, jotka antavat kehittäjille tarkan hallinnan päättelykykyihin ja kustannuksiin.
Googlen Gemini Diffusion mullistaa tekoälytekstin generoinnin

Google DeepMind on esitellyt Gemini Diffusionin, vallankumouksellisen lähestymistavan tekoälytekstin generointiin, joka eroaa merkittävästi perinteisistä autoregressiivisista kielimalleista.

Toisin kuin tavanomaiset mallit, jotka tuottavat tekstiä yksi token kerrallaan järjestyksessä, Gemini Diffusion hyödyntää diffuusioteknologiaa – aiemmin lähinnä kuva- ja videotuotannossa käytettyä – jalostaakseen satunnaista kohinaa johdonmukaiseksi tekstiksi iteratiivisen prosessin avulla. Tämän uudenlaisen lähestymistavan ansiosta malli kykenee tuottamaan sisältöä huikealla, jopa 2 000 tokenin sekuntinopeudella DeepMindin tutkijoiden mukaan.

"Sen sijaan, että mallit ennustaisivat tekstiä suoraan, ne oppivat tuottamaan lopputuloksia jalostamalla kohinaa askel askeleelta", Google selittää tiedotteessaan. "Tämä mahdollistaa ratkaisun nopean iteroinnin ja virheiden korjaamisen jo generoinnin aikana."

Kokeellinen demo, joka on tällä hetkellä saatavilla jonotuslistan kautta, osoittaa, kuinka teknologia yltää Googlen nykyisten mallien koodauskykyyn samalla kun generointiaika lyhenee dramaattisesti. Vertailutesteissä Gemini Diffusion suoriutuu ohjelmointitehtävissä, kuten HumanEval ja MBPP, lähes identtisesti Gemini 2.0 Flash-Lite -mallin kanssa.

Oriol Vinyals, Google DeepMindin tutkimusjohtaja ja syväoppimisen vetäjä sekä Gemini-projektin toinen johtaja, kuvaili julkaisua henkilökohtaiseksi merkkipaaluksi ja totesi demon olleen niin nopea, että videota piti hidastaa, jotta sitä pystyi seuraamaan.

Samanaikaisesti Google on kehittänyt Gemini 2.5 -mallistoaan uusilla ominaisuuksilla. Yhtiö julkaisi Gemini 2.5 Flashin ajattelubudjeteilla, jotka antavat kehittäjille ennennäkemättömän hallinnan tekoälyn päättelymäärään. Ominaisuuden avulla käyttäjät voivat tasapainottaa laatua, viivettä ja kustannuksia asettamalla mallin päättelylle token-rajan (jopa 24 576 tokenia).

Google laajentaa ajattelubudjetit myös Gemini 2.5 Pro -malliin, jonka yleinen saatavuus on tulossa lähiviikkoina. Lisäksi yhtiö on lisännyt natiivin SDK-tuen Model Context Protocol (MCP) -määritelmille Gemini API:ssa, mikä helpottaa integraatiota avoimen lähdekoodin työkaluihin ja agenttipohjaisten sovellusten rakentamista.

Nämä edistysaskeleet ilmentävät Googlen pyrkimystä tehdä tekoälystä entistä tehokkaampaa, hallittavampaa ja kehittäjille saavutettavampaa suorituskyvystä tinkimättä.

Source:

Latest News