menu
close

Googles Gemini Diffusion revolutionerer AI-tekstgenerering

Google har lanceret Gemini Diffusion, en banebrydende tekstgenereringsmodel, der omdanner tilfældig støj til sammenhængende tekst op til fem gange hurtigere end tidligere modeller. Den eksperimentelle model benytter diffusionsteknologi—kendt fra billedgenerering—til at producere op til 2.000 tokens i sekundet, samtidig med at den matcher kodningspræstationen fra eksisterende modeller. Google har desuden opgraderet sin Gemini 2.5-serie med 'thinking budgets', der giver udviklere præcis kontrol over AI’ens ræsonnement og omkostninger.
Googles Gemini Diffusion revolutionerer AI-tekstgenerering

Google DeepMind har introduceret Gemini Diffusion, en revolutionerende tilgang til AI-tekstgenerering, der markerer et markant brud med traditionelle autoregressive sprogmodeller.

I modsætning til konventionelle modeller, der genererer tekst én token ad gangen i rækkefølge, anvender Gemini Diffusion diffusionsteknologi—tidligere primært brugt til billed- og videogenerering—til at forfine tilfældig støj til sammenhængende tekst gennem en iterativ proces. Denne nye metode gør det muligt for modellen at generere indhold med imponerende hastigheder på op til 2.000 tokens i sekundet, ifølge forskere fra DeepMind.

"I stedet for at forudsige tekst direkte, lærer de at generere output ved gradvist at forfine støj, trin for trin," forklarer Google i sin meddelelse. "Det betyder, at de hurtigt kan iterere på en løsning og rette fejl under genereringen."

Den eksperimentelle demo, der i øjeblikket er tilgængelig via venteliste, demonstrerer, hvordan teknologien kan matche kodningspræstationen fra Googles eksisterende modeller, samtidig med at genereringstiden reduceres markant. I benchmarks præsterer Gemini Diffusion på niveau med Gemini 2.0 Flash-Lite i programmeringsopgaver som HumanEval og MBPP, med næsten identiske resultater.

Oriol Vinyals, VP for Research og Deep Learning Lead hos Google DeepMind samt Co-Head for Gemini-projektet, beskrev lanceringen som en personlig milepæl og bemærkede, at demoen kørte så hurtigt, at de måtte sænke videoens hastighed for at gøre den sebar.

Sideløbende har Google opgraderet sin Gemini 2.5-serie med nye muligheder. Virksomheden har lanceret Gemini 2.5 Flash med 'thinking budgets', der giver udviklere hidtil uset kontrol over, hvor meget ræsonnement deres AI udfører. Denne funktion gør det muligt for brugere at balancere kvalitet, latenstid og omkostninger ved at sætte en token-grænse (op til 24.576 tokens) for modellens ræsonnementsproces.

Google udvider også 'thinking budgets' til Gemini 2.5 Pro, hvor generel tilgængelighed forventes inden for de kommende uger. Derudover har virksomheden tilføjet indbygget SDK-understøttelse for Model Context Protocol (MCP)-definitioner i Gemini API’en, hvilket gør det lettere at integrere med open source-værktøjer og udvikle agentbaserede applikationer.

Disse fremskridt repræsenterer samlet set Googles bestræbelser på at gøre AI mere effektiv, kontrollerbar og tilgængelig for udviklere, samtidig med at de høje ydelsesstandarder opretholdes.

Source:

Latest News