menu
close

Google laajentaa tekoälyn kustannushallintaa Gemini 2.5 Pro -malliin

Google on laajentanut 'ajattelubudjetit'-ominaisuutensa Gemini 2.5 Flashista myös Gemini 2.5 Pro -malliin, tarjoten kehittäjille tarkemman hallinnan tekoälyn päättelykustannuksiin. Ominaisuuden avulla käyttäjät voivat rajoittaa mallin päättelyyn käyttämien tokenien määrää tai poistaa ajattelun kokonaan käytöstä, mikä mahdollistaa tasapainon suorituskyvyn ja taloudellisen tehokkuuden välillä. Tämä ratkaisee keskeisen haasteen yrityksille, jotka ottavat käyttöön kehittyneitä tekoälyratkaisuja laajassa mittakaavassa, sillä päättelykyvyt tuovat yleensä merkittävästi korkeammat käyttökustannukset.
Google laajentaa tekoälyn kustannushallintaa Gemini 2.5 Pro -malliin

Google on ilmoittanut laajentavansa innovatiivisen 'ajattelubudjetit'-ominaisuuden myös Gemini 2.5 Pro -malliin, joka on yhtiön edistynein tekoälyn päättelyyn perustuva malli. Ominaisuus otettiin aiemmin tänä vuonna käyttöön Gemini 2.5 Flashissa.

Ajattelubudjetit edustavat merkittävää edistysaskelta tekoälyn kustannusten hallinnassa, sillä ne mahdollistavat kehittäjille tarkan kontrollin siitä, kuinka paljon laskentatehoa mallin päättelyyn käytetään monimutkaisten ongelmien ratkaisemiseksi. Käyttäjät voivat määrittää, kuinka monta tokenia malli saa käyttää sisäiseen päättelyyn ennen vastauksen tuottamista, tai kytkeä ajattelutoiminnot kokonaan pois yksinkertaisissa tehtävissä.

"Julkaisimme 2.5 Flashin ajattelubudjeteilla antaaksemme kehittäjille enemmän kontrollia kustannuksiin viiveen ja laadun tasapainottamisen kautta. Nyt laajennamme tämän ominaisuuden myös 2.5 Pro -malliin", Google kertoi tiedotteessaan. Yhtiö vahvisti, että Gemini 2.5 Pro ajattelubudjeteilla tulee yleisesti saataville vakaisiin tuotantoympäristöihin lähiviikkoina.

Tämä kehitys vastaa olennaiseen haasteeseen nykyisillä tekoälymarkkinoilla, joissa kehittyneempi päättely lisää sekä viivettä että kustannuksia. Esimerkiksi Gemini 2.5 Flashissa päättelyn käyttöönotto nostaa tuottokustannukset lähes kuusinkertaisiksi – 0,60 dollarista 3,50 dollariin miljoonaa tokenia kohden. Ajattelubudjettien avulla yritykset voivat optimoida tekoälyn käyttöä tapauskohtaisesti ja ottaa päättelyn käyttöön vain tarpeen mukaan.

Ominaisuus on erityisen hyödyllinen yritysasiakkaille, joiden täytyy hallita tekoälyn käyttökustannuksia tarkasti, mutta silti hyödyntää edistyneitä toiminnallisuuksia. Esimerkiksi yksinkertaisissa kyselyissä, kuten kielten käännöksissä tai perustiedon haussa, ajattelu voidaan poistaa käytöstä kustannustehokkuuden maksimoimiseksi. Monimutkaisissa tehtävissä, kuten matemaattisessa ongelmanratkaisussa tai syvällisessä analyysissä, ajattelutoiminto voidaan ottaa käyttöön ja säätää tarpeen mukaan.

Tekoälyn integroituminen yritysten prosesseihin kiihtyy, ja Googlen lähestymistapa räätälöitävään päättelyyn kuvastaa kypsyvää markkinaa, jossa kustannusoptimointi ja suorituskyvyn hienosäätö ovat yhtä tärkeitä kuin itse tekniset kyvyt – tämä merkitsee uutta vaihetta generatiivisen tekoälyn kaupallistumisessa.

Source:

Latest News