menu
close

La cinese DeepSeek riduce il divario con i giganti occidentali dell’IA

La startup cinese DeepSeek ha lanciato il nuovo modello R1-0528, che mostra prestazioni in grado di competere con le migliori soluzioni di OpenAI e Google. Il modello evidenzia notevoli miglioramenti nel ragionamento matematico, nella programmazione e nelle capacità logiche, con un’accuratezza passata dal 70% all’87,5% nel test matematico AIME 2025. Questo sviluppo riflette i risultati dell’AI Index 2025 della Stanford University, secondo cui il divario tra i principali modelli di IA statunitensi e cinesi si è drasticamente ridotto nell’ultimo anno.
La cinese DeepSeek riduce il divario con i giganti occidentali dell’IA

DeepSeek, startup cinese nel campo dell’intelligenza artificiale, si è affermata come un valido sfidante al predominio occidentale con l’aggiornamento del suo modello R1-0528, che ora raggiunge livelli di performance vicini a quelli dei leader di settore OpenAI e Google.

Nonostante DeepSeek abbia definito l’aggiornamento come una “minor version upgrade”, il modello presenta miglioramenti sostanziali nelle capacità chiave. Nel ragionamento matematico, l’accuratezza del modello nel difficile test AIME 2025 è salita dal 70% all’87,5%, dimostrando una maggiore abilità nella risoluzione dei problemi. Questo progresso è dovuto a una maggiore profondità di ragionamento, con il modello che ora utilizza circa 23.000 token per query rispetto ai 12.000 della versione precedente.

Oltre alla matematica, il modello R1-0528 mostra progressi significativi anche nella programmazione. Nel test di programmazione Codeforces, il modello ha raggiunto un punteggio di circa 1930, rispetto ai 1530 precedenti: un miglioramento di 400 punti che riflette una superiore capacità di generazione di codice e risoluzione di problemi. Anche le sue prestazioni nei test di coding più completi sono notevolmente cresciute.

I progressi del modello sono in linea con quanto rilevato dall’AI Index Report 2025 della Stanford University, che documenta una drastica riduzione del divario di performance tra i principali modelli di IA statunitensi e cinesi. Secondo il rapporto, la differenza tra i modelli americani e cinesi di punta nei principali benchmark è passata da valori a doppia cifra nel 2023 a una quasi parità all’inizio del 2025. Nella Chatbot Arena Leaderboard, il divario tra i migliori modelli statunitensi e cinesi si è ridotto dal 9,26% di gennaio 2024 all’1,70% di febbraio 2025.

Anche i leader del settore hanno riconosciuto questo cambiamento. Il CEO di Nvidia, Jensen Huang, ha dichiarato a maggio che “DeepSeek e [Qwen di Alibaba] dalla Cina sono tra i migliori modelli open-source di IA rilasciati liberamente. Hanno guadagnato popolarità negli Stati Uniti, in Europa e oltre”.

Il successo di DeepSeek è particolarmente rilevante considerando che l’azienda è nata come una startup relativamente piccola. Il modello è disponibile con una licenza permissiva, sia nella versione completa sia in una variante “distilled” più leggera, in grado di funzionare anche su hardware meno potente, rendendo così le capacità avanzate dell’IA più accessibili agli sviluppatori di tutto il mondo.

Source:

Latest News