Googles Gemini Diffusion revolutionerer AI-tekstgenerering

Google har lanceret Gemini Diffusion, en banebrydende tekstgenereringsmodel, der omdanner tilfældig støj til sammenhængende tekst op til fem gange hurtigere end tidligere modeller. Den eksperimentelle model benytter diffusionsteknologi—kendt fra billedgenerering—til at producere op til 2.000 tokens i sekundet, samtidig med at den matcher kodningspræstationen fra eksisterende modeller. Google har desuden opgraderet sin Gemini 2.5-serie med 'thinking budgets', der giver udviklere præcis kontrol over AI’ens ræsonnement og omkostninger.

Google DeepMind har introduceret Gemini Diffusion, en revolutionerende tilgang til AI-tekstgenerering, der markerer et markant brud med traditionelle autoregressive sprogmodeller.

I modsætning til konventionelle modeller, der genererer tekst én token ad gangen i rækkefølge, anvender Gemini Diffusion diffusionsteknologi—tidligere primært brugt til billed- og videogenerering—til at forfine tilfældig støj til sammenhængende tekst gennem en iterativ proces. Denne nye metode gør det muligt for modellen at generere indhold med imponerende hastigheder på op til 2.000 tokens i sekundet, ifølge forskere fra DeepMind.

"I stedet for at forudsige tekst direkte, lærer de at generere output ved gradvist at forfine støj, trin for trin," forklarer Google i sin meddelelse. "Det betyder, at de hurtigt kan iterere på en løsning og rette fejl under genereringen."

Den eksperimentelle demo, der i øjeblikket er tilgængelig via venteliste, demonstrerer, hvordan teknologien kan matche kodningspræstationen fra Googles eksisterende modeller, samtidig med at genereringstiden reduceres markant. I benchmarks præsterer Gemini Diffusion på niveau med Gemini 2.0 Flash-Lite i programmeringsopgaver som HumanEval og MBPP, med næsten identiske resultater.

Oriol Vinyals, VP for Research og Deep Learning Lead hos Google DeepMind samt Co-Head for Gemini-projektet, beskrev lanceringen som en personlig milepæl og bemærkede, at demoen kørte så hurtigt, at de måtte sænke videoens hastighed for at gøre den sebar.

Sideløbende har Google opgraderet sin Gemini 2.5-serie med nye muligheder. Virksomheden har lanceret Gemini 2.5 Flash med 'thinking budgets', der giver udviklere hidtil uset kontrol over, hvor meget ræsonnement deres AI udfører. Denne funktion gør det muligt for brugere at balancere kvalitet, latenstid og omkostninger ved at sætte en token-grænse (op til 24.576 tokens) for modellens ræsonnementsproces.

Google udvider også 'thinking budgets' til Gemini 2.5 Pro, hvor generel tilgængelighed forventes inden for de kommende uger. Derudover har virksomheden tilføjet indbygget SDK-understøttelse for Model Context Protocol (MCP)-definitioner i Gemini API’en, hvilket gør det lettere at integrere med open source-værktøjer og udvikle agentbaserede applikationer.

Disse fremskridt repræsenterer samlet set Googles bestræbelser på at gøre AI mere effektiv, kontrollerbar og tilgængelig for udviklere, samtidig med at de høje ydelsesstandarder opretholdes.

Source:

Googles Gemini Diffusion revolutionerer AI-tekstgenerering

Latest News

SEC Skærper Indsatsen mod Vildledende AI-Påstande

Dommer Overvejer AI's Indflydelse i Kampen om Google Antitrust-Sanktioner

Top AI-innovatører hædret ved Excellence Awards 2025

WildFusion Giver Robotter Menneskelignende Sanser til Udendørs Navigation

Følefeedback ved Fingerspidserne: Nye Haptiske Værktøjer Forvandler Sikkerheden ved Industrirobotter

VentureBeat sætter fokus på store AI-fremskridt i maj 2025

AI-hjerner driver Kinas revolution inden for humanoide robotter

Robotter Mestrer Sociale Færdigheder Uden Menneskelig Overvågning

NYT indgår første AI-indholdsaftale med Amazon for Alexa

Grammarly sikrer 1 mia. dollars for at transformere sig fra skriveværktøj til AI-platform

Googles Gemini Diffusion revolutionerer AI-tekstgenerering

Related Articles

Dommer Overvejer AI's Indflydelse i Kampen om Google Antitrust-Sanktioner

VentureBeat sætter fokus på store AI-fremskridt i maj 2025

DeepSeek opgraderer R1 AI-model og udfordrer vestlige teknologigiganter

Google Beam: Revolutionerende 3D-videosamtaler lanceres i 2025

Google lancerer Gemini 2.5 Deep Think på I/O 2025

Latest News

SEC Skærper Indsatsen mod Vildledende AI-Påstande

Dommer Overvejer AI's Indflydelse i Kampen om Google Antitrust-Sanktioner

Top AI-innovatører hædret ved Excellence Awards 2025

WildFusion Giver Robotter Menneskelignende Sanser til Udendørs Navigation

Følefeedback ved Fingerspidserne: Nye Haptiske Værktøjer Forvandler Sikkerheden ved Industrirobotter

VentureBeat sætter fokus på store AI-fremskridt i maj 2025

AI-hjerner driver Kinas revolution inden for humanoide robotter

Robotter Mestrer Sociale Færdigheder Uden Menneskelig Overvågning

NYT indgår første AI-indholds­aftale med Amazon for Alexa

Grammarly sikrer 1 mia. dollars for at transformere sig fra skriveværktøj til AI-platform

NYT indgår første AI-indholdsaftale med Amazon for Alexa