DeepSeek, la startup cinese di intelligenza artificiale che a gennaio aveva fatto crollare i titoli tecnologici con il suo rivoluzionario modello R1, ha lanciato in sordina un importante aggiornamento del suo sistema AI di punta.
La nuova versione, denominata DeepSeek-R1-0528, è stata rilasciata il 28 maggio tramite un breve annuncio nel gruppo WeChat dell’azienda. Nonostante DeepSeek l’abbia presentata come una 'piccola prova di aggiornamento', i primi test evidenziano miglioramenti sostanziali in diversi ambiti.
Secondo la classifica LiveCodeBench, il modello aggiornato ora si posiziona al quarto posto per capacità di programmazione con un punteggio Pass@1 di 73,1, subito dietro ai modelli O3 e O4-Mini di OpenAI. Si tratta di un balzo in avanti notevole per un modello open-source, soprattutto considerando le risorse molto più limitate rispetto ai concorrenti occidentali.
Le specifiche tecniche mostrano che R1-0528 mantiene l’architettura Mixture-of-Experts (MoE) del predecessore, con circa 685 miliardi di parametri totali, anche se solo circa 37 miliardi sono attivi durante l’inferenza. Il modello ora supporta una finestra di contesto estesa fino a 128.000 token, consentendo l’elaborazione di documenti e basi di codice molto più ampie.
I feedback degli utenti segnalano miglioramenti nella profondità di ragionamento, nella qualità della scrittura e nelle capacità di problem solving. Gli sviluppatori riferiscono che il modello ora può sostenere sessioni di ragionamento prolungate, della durata di 30-60 minuti per compiti complessi, in modo simile ai modelli di Google. L’aggiornamento risolve anche alcune anomalie precedenti nella generazione di testo, producendo contenuti più naturali e meglio formattati.
L’innovazione continua di DeepSeek mette in discussione l’idea che per scalare l’AI siano necessari enormi potenze di calcolo e investimenti. Il successo dell’azienda con modelli open-source ed efficienti dal punto di vista dei costi ha già costretto i giganti tecnologici a reagire: OpenAI ha abbassato i prezzi e Google ha introdotto livelli di accesso scontati. Nel frattempo, concorrenti cinesi come Alibaba e Tencent hanno rilasciato propri modelli, dichiarando di superare le capacità di DeepSeek.
L’aggiornamento R1-0528 è disponibile su Hugging Face con licenza MIT, che ne consente l’uso commerciale e le modifiche. Gli osservatori del settore si aspettano che DeepSeek rilasci nei prossimi mesi il modello R2, ancora più completo, con il potenziale di sconvolgere ulteriormente il panorama dell’intelligenza artificiale.