Googlen Gemini Diffusion mullistaa tekoälytekstin generoinnin

Google on esitellyt Gemini Diffusionin, uraauurtavan tekstin generointimallin, joka muuntaa satunnaisen kohinan johdonmukaiseksi tekstiksi jopa viisi kertaa aiempia malleja nopeammin. Kokeellinen malli hyödyntää diffuusioteknologiaa – samankaltaista kuin kuvien generoinnissa – tuottaen jopa 2 000 tokenia sekunnissa ja yltäen samalla nykyisten mallien koodauskykyyn. Google on myös parantanut Gemini 2.5 -mallistoaan ajattelubudjeteilla, jotka antavat kehittäjille tarkan hallinnan päättelykykyihin ja kustannuksiin.

Google DeepMind on esitellyt Gemini Diffusionin, vallankumouksellisen lähestymistavan tekoälytekstin generointiin, joka eroaa merkittävästi perinteisistä autoregressiivisista kielimalleista.

Toisin kuin tavanomaiset mallit, jotka tuottavat tekstiä yksi token kerrallaan järjestyksessä, Gemini Diffusion hyödyntää diffuusioteknologiaa – aiemmin lähinnä kuva- ja videotuotannossa käytettyä – jalostaakseen satunnaista kohinaa johdonmukaiseksi tekstiksi iteratiivisen prosessin avulla. Tämän uudenlaisen lähestymistavan ansiosta malli kykenee tuottamaan sisältöä huikealla, jopa 2 000 tokenin sekuntinopeudella DeepMindin tutkijoiden mukaan.

"Sen sijaan, että mallit ennustaisivat tekstiä suoraan, ne oppivat tuottamaan lopputuloksia jalostamalla kohinaa askel askeleelta", Google selittää tiedotteessaan. "Tämä mahdollistaa ratkaisun nopean iteroinnin ja virheiden korjaamisen jo generoinnin aikana."

Kokeellinen demo, joka on tällä hetkellä saatavilla jonotuslistan kautta, osoittaa, kuinka teknologia yltää Googlen nykyisten mallien koodauskykyyn samalla kun generointiaika lyhenee dramaattisesti. Vertailutesteissä Gemini Diffusion suoriutuu ohjelmointitehtävissä, kuten HumanEval ja MBPP, lähes identtisesti Gemini 2.0 Flash-Lite -mallin kanssa.

Oriol Vinyals, Google DeepMindin tutkimusjohtaja ja syväoppimisen vetäjä sekä Gemini-projektin toinen johtaja, kuvaili julkaisua henkilökohtaiseksi merkkipaaluksi ja totesi demon olleen niin nopea, että videota piti hidastaa, jotta sitä pystyi seuraamaan.

Samanaikaisesti Google on kehittänyt Gemini 2.5 -mallistoaan uusilla ominaisuuksilla. Yhtiö julkaisi Gemini 2.5 Flashin ajattelubudjeteilla, jotka antavat kehittäjille ennennäkemättömän hallinnan tekoälyn päättelymäärään. Ominaisuuden avulla käyttäjät voivat tasapainottaa laatua, viivettä ja kustannuksia asettamalla mallin päättelylle token-rajan (jopa 24 576 tokenia).

Google laajentaa ajattelubudjetit myös Gemini 2.5 Pro -malliin, jonka yleinen saatavuus on tulossa lähiviikkoina. Lisäksi yhtiö on lisännyt natiivin SDK-tuen Model Context Protocol (MCP) -määritelmille Gemini API:ssa, mikä helpottaa integraatiota avoimen lähdekoodin työkaluihin ja agenttipohjaisten sovellusten rakentamista.

Nämä edistysaskeleet ilmentävät Googlen pyrkimystä tehdä tekoälystä entistä tehokkaampaa, hallittavampaa ja kehittäjille saavutettavampaa suorituskyvystä tinkimättä.

Source:

Googlen Gemini Diffusion mullistaa tekoälytekstin generoinnin

Latest News

SEC tehostaa toimia harhaanjohtavien tekoälyväitteiden kitkemiseksi

Tuomari pohtii tekoälyn vaikutusta Googlen kilpailuoikeudellisissa seuraamuksissa

Huippuluokan tekoälyinnovaattorit palkittiin vuoden 2025 Excellence Awards -gaalassa

WildFusion antaa roboteille ihmismäiset aistit ulkona liikkumiseen

Sormenpääpalaute: Uudet haptiset työkalut mullistavat teollisuusrobottien turvallisuuden

VentureBeat nostaa esiin merkittäviä tekoälykehityksiä toukokuussa 2025

Tekoäly aivoina: Kiina johtaa humanoidirobottien vallankumousta

Robotit Hallitsevat Sosiaaliset Taidot Ilman Ihmisen Ohjausta

NYT solmii ensimmäisen tekoälysisältösopimuksen Amazonin kanssa Alexaa varten

Grammarly kerää miljardin dollarin rahoituksen – muuntautuu kirjoitustyökalusta tekoälyalustaksi

Googlen Gemini Diffusion mullistaa tekoälytekstin generoinnin

Related Articles

Tuomari pohtii tekoälyn vaikutusta Googlen kilpailuoikeudellisissa seuraamuksissa

VentureBeat nostaa esiin merkittäviä tekoälykehityksiä toukokuussa 2025

DeepSeek päivittää R1-tekoälymalliaan – haastaa länsimaiset teknologiayritykset

Google Beam: Vallankumouksellinen 3D-videopuheluteknologia saapuu vuonna 2025

Google esittelee Gemini 2.5 Deep Thinkin I/O 2025 -tapahtumassa

Latest News

SEC tehostaa toimia harhaanjohtavien tekoälyväitteiden kitkemiseksi

Tuomari pohtii tekoälyn vaikutusta Googlen kilpailuoikeudellisissa seuraamuksissa

Huippuluokan tekoälyinnovaattorit palkittiin vuoden 2025 Excellence Awards -gaalassa

WildFusion antaa roboteille ihmismäiset aistit ulkona liikkumiseen

Sormenpääpalaute: Uudet haptiset työkalut mullistavat teollisuusrobottien turvallisuuden

VentureBeat nostaa esiin merkittäviä tekoälykehityksiä toukokuussa 2025

Tekoäly aivoina: Kiina johtaa humanoidirobottien vallankumousta

Robotit Hallitsevat Sosiaaliset Taidot Ilman Ihmisen Ohjausta

NYT solmii ensimmäisen tekoälysisältösopimuksen Amazonin kanssa Alexaa varten

Grammarly kerää miljardin dollarin rahoituksen – muuntautuu kirjoitustyökalusta tekoälyalustaksi