Gemini Diffusion di Google rivoluziona la generazione di testo AI

Google ha presentato Gemini Diffusion, un modello innovativo per la generazione di testo che trasforma il rumore casuale in testo coerente a velocità fino a cinque volte superiori rispetto ai modelli precedenti. Questo modello sperimentale utilizza la tecnologia di diffusione—simile alle tecniche di generazione di immagini—per produrre fino a 2.000 token al secondo, mantenendo prestazioni di codifica pari ai modelli esistenti. Google ha inoltre potenziato la linea Gemini 2.5 con 'thinking budgets', che offrono agli sviluppatori un controllo preciso sulle capacità di ragionamento e sui costi.

Google DeepMind ha introdotto Gemini Diffusion, un approccio rivoluzionario alla generazione di testo tramite intelligenza artificiale che segna un netto distacco dai tradizionali modelli linguistici autoregressivi.

A differenza dei modelli convenzionali che generano testo un token alla volta in sequenza, Gemini Diffusion impiega la tecnologia di diffusione—utilizzata finora principalmente nella generazione di immagini e video—per raffinare il rumore casuale in testo coerente attraverso un processo iterativo. Questo nuovo approccio consente al modello di generare contenuti a velocità sorprendenti, fino a 2.000 token al secondo, secondo quanto dichiarato dai ricercatori di DeepMind.

"Invece di prevedere direttamente il testo, imparano a generare output raffinando il rumore, passo dopo passo", spiega Google nel suo annuncio. "Ciò significa che possono iterare molto rapidamente su una soluzione e correggere errori durante il processo di generazione."

La demo sperimentale, attualmente disponibile tramite lista d'attesa, dimostra come questa tecnologia possa eguagliare le prestazioni di codifica dei modelli esistenti di Google, riducendo drasticamente i tempi di generazione. Nei benchmark, Gemini Diffusion si comporta in modo paragonabile a Gemini 2.0 Flash-Lite su compiti di programmazione come HumanEval e MBPP, mostrando risultati quasi identici.

Oriol Vinyals, VP of Research e responsabile Deep Learning di Google DeepMind nonché Co-Head del progetto Gemini, ha descritto il rilascio come una pietra miliare personale, sottolineando che la demo era così veloce da dover rallentare il video per renderlo visibile.

In parallelo, Google ha potenziato la linea Gemini 2.5 con nuove funzionalità. L'azienda ha lanciato Gemini 2.5 Flash con 'thinking budgets', offrendo agli sviluppatori un controllo senza precedenti su quanto ragionamento l'IA debba effettuare. Questa funzione consente agli utenti di bilanciare qualità, latenza e costi impostando un limite di token (fino a 24.576 token) per il processo di ragionamento del modello.

Google sta inoltre estendendo i 'thinking budgets' a Gemini 2.5 Pro, con disponibilità generale prevista nelle prossime settimane. Inoltre, l'azienda ha aggiunto il supporto nativo per le definizioni Model Context Protocol (MCP) nell'SDK Gemini API, facilitando l'integrazione con strumenti open-source e la creazione di applicazioni agentiche.

Questi progressi rappresentano collettivamente l'impegno di Google nel rendere l'IA più efficiente, controllabile e accessibile agli sviluppatori, mantenendo alti standard prestazionali.

Source:

Gemini Diffusion di Google rivoluziona la generazione di testo AI

Latest News

La SEC Intensifica la Stretta sulle Dichiarazioni Ingannevoli sull’IA

Il giudice valuta l’impatto dell’IA nelle misure antitrust contro Google

I migliori innovatori dell’IA premiati agli Excellence Awards 2025

WildFusion Dona ai Robot Sensi Umani per la Navigazione all’Aperto

Feedback alle Dita: Nuovi Strumenti Aptici Trasformano la Sicurezza dei Robot Industriali

VentureBeat mette in luce i principali progressi dell’IA a maggio 2025

Cervelli AI alimentano la rivoluzione dei robot umanoidi in Cina

I robot imparano le abilità sociali senza supervisione umana

Il NYT sigla il primo accordo sui contenuti AI con Amazon per Alexa

Grammarly Ottiene 1 Miliardo di Dollari per Trasformarsi da Strumento di Scrittura a Piattaforma AI

Gemini Diffusion di Google rivoluziona la generazione di testo AI

Related Articles

Il giudice valuta l’impatto dell’IA nelle misure antitrust contro Google

VentureBeat mette in luce i principali progressi dell’IA a maggio 2025

DeepSeek aggiorna il modello AI R1 e sfida i giganti tecnologici occidentali

Google Beam: La Videochiamata 3D Rivoluzionaria Arriva nel 2025

Google presenta Gemini 2.5 Deep Think all’I/O 2025

Latest News

La SEC Intensifica la Stretta sulle Dichiarazioni Ingannevoli sull’IA

Il giudice valuta l’impatto dell’IA nelle misure antitrust contro Google

I migliori innovatori dell’IA premiati agli Excellence Awards 2025

WildFusion Dona ai Robot Sensi Umani per la Navigazione all’Aperto

Feedback alle Dita: Nuovi Strumenti Aptici Trasformano la Sicurezza dei Robot Industriali

VentureBeat mette in luce i principali progressi dell’IA a maggio 2025

Cervelli AI alimentano la rivoluzione dei robot umanoidi in Cina

I robot imparano le abilità sociali senza supervisione umana

Il NYT sigla il primo accordo sui contenuti AI con Amazon per Alexa

Grammarly Ottiene 1 Miliardo di Dollari per Trasformarsi da Strumento di Scrittura a Piattaforma AI