Googles Gemini Diffusion revolutionerar AI-textgenerering

Google har presenterat Gemini Diffusion, en banbrytande textgenereringsmodell som omvandlar slumpmässigt brus till sammanhängande text upp till fem gånger snabbare än tidigare modeller. Den experimentella modellen använder diffusionsteknik—liknande den som används för bildgenerering—för att producera upp till 2 000 token per sekund och matchar samtidigt kodningsprestandan hos befintliga modeller. Google har även förbättrat sin Gemini 2.5-serie med så kallade "thinking budgets" som ger utvecklare exakt kontroll över resonemangsförmåga och kostnad.

Google DeepMind har introducerat Gemini Diffusion, ett revolutionerande tillvägagångssätt för AI-textgenerering som markerar ett betydande avsteg från traditionella autoregressiva språkmodeller.

Till skillnad från konventionella modeller som genererar text en token i taget i sekvens, använder Gemini Diffusion diffusionsteknik—tidigare främst använd inom bild- och videoproduktion—för att stegvis förfina slumpmässigt brus till sammanhängande text. Detta nya angreppssätt gör det möjligt för modellen att generera innehåll i imponerande hastigheter på upp till 2 000 token per sekund, enligt forskare på DeepMind.

"Istället för att förutsäga text direkt, lär de sig att generera utdata genom att steg för steg förfina brus," förklarar Google i sitt tillkännagivande. "Det innebär att de snabbt kan iterera fram en lösning och korrigera fel under själva genereringsprocessen."

Den experimentella demon, som för närvarande är tillgänglig via väntelista, visar hur tekniken kan matcha kodningsprestandan hos Googles befintliga modeller samtidigt som genereringstiden minskar dramatiskt. I benchmarktester presterar Gemini Diffusion jämförbart med Gemini 2.0 Flash-Lite på programmeringsuppgifter som HumanEval och MBPP, med nästintill identiska resultat.

Oriol Vinyals, forskningschef och ansvarig för djupinlärning på Google DeepMind samt medansvarig för Gemini-projektet, beskrev lanseringen som en personlig milstolpe och noterade att demon gick så snabbt att de var tvungna att sakta ner videon för att den skulle vara möjlig att titta på.

Parallellt har Google förbättrat sin Gemini 2.5-serie med nya funktioner. Företaget har lanserat Gemini 2.5 Flash med "thinking budgets", vilket ger utvecklare enastående kontroll över hur mycket resonemang AI:n utför. Denna funktion gör det möjligt för användare att balansera kvalitet, svarstid och kostnad genom att sätta en token-gräns (upp till 24 576 token) för modellens resonemangsprocess.

Google utökar även "thinking budgets" till Gemini 2.5 Pro, med allmän tillgänglighet inom de närmaste veckorna. Dessutom har företaget lagt till inbyggt SDK-stöd för Model Context Protocol (MCP)-definitioner i Gemini API, vilket förenklar integrationen med öppen källkod och utveckling av agentbaserade applikationer.

Dessa framsteg representerar sammantaget Googles satsning på att göra AI mer effektiv, kontrollerbar och tillgänglig för utvecklare, samtidigt som höga prestandakrav bibehålls.

Source:

Googles Gemini Diffusion revolutionerar AI-textgenerering

Latest News

SEC trappar upp tillsynen mot vilseledande AI-påståenden

Domare väger in AI:s påverkan i kampen om konkurrensrättsliga åtgärder mot Google

Toppinnovatörer inom AI hedras vid 2025 års Excellence Awards

WildFusion Ger Robotar Mänskliga Sinnen för Utomhusnavigering

Fingerkänsla: Nya haptiska verktyg förändrar säkerheten för industrirobotar

VentureBeat lyfter fram stora AI-genombrott i maj 2025

AI-hjärnor driver Kinas revolution inom humanoida robotar

Robotar Behärskar Sociala Färdigheter Utan Mänsklig Övervakning

NYT ingår första AI-innehållsavtal med Amazon för Alexa

Grammarly får in 1 miljard dollar för att omvandlas från skrivverktyg till AI-plattform

Googles Gemini Diffusion revolutionerar AI-textgenerering

Related Articles

Domare väger in AI:s påverkan i kampen om konkurrensrättsliga åtgärder mot Google

VentureBeat lyfter fram stora AI-genombrott i maj 2025

DeepSeek uppgraderar R1 AI-modellen och utmanar västerländska teknikjättar

Google Beam: Revolutionerande 3D-videosamtal lanseras 2025

Google Avtäcker Gemini 2.5 Deep Think på I/O 2025

Latest News

SEC trappar upp tillsynen mot vilseledande AI-påståenden

Domare väger in AI:s påverkan i kampen om konkurrensrättsliga åtgärder mot Google

Toppinnovatörer inom AI hedras vid 2025 års Excellence Awards

WildFusion Ger Robotar Mänskliga Sinnen för Utomhusnavigering

Fingerkänsla: Nya haptiska verktyg förändrar säkerheten för industrirobotar

VentureBeat lyfter fram stora AI-genombrott i maj 2025

AI-hjärnor driver Kinas revolution inom humanoida robotar

Robotar Behärskar Sociala Färdigheter Utan Mänsklig Övervakning

NYT ingår första AI-innehållsavtal med Amazon för Alexa

Grammarly får in 1 miljard dollar för att omvandlas från skrivverktyg till AI-plattform