Η DeepSeek, μια κινεζική startup τεχνητής νοημοσύνης, εδραιώνεται ως ισχυρός ανταγωνιστής στην κυριαρχία της Δύσης στην AI με την τελευταία αναβάθμιση του μοντέλου της, R1-0528, το οποίο πλέον αποδίδει σε επίπεδα που προσεγγίζουν τους ηγέτες της βιομηχανίας OpenAI και Google.
Το αναβαθμισμένο μοντέλο, αν και χαρακτηρίζεται από τη DeepSeek ως «μικρή αναβάθμιση έκδοσης», προσφέρει ουσιαστικές βελτιώσεις σε βασικές δυνατότητες. Στη μαθηματική συλλογιστική, η ακρίβεια του μοντέλου στη δύσκολη δοκιμή AIME 2025 εκτοξεύτηκε από 70% σε 87,5%, αποδεικνύοντας ενισχυμένες ικανότητες επίλυσης προβλημάτων. Αυτή η πρόοδος οφείλεται στο αυξημένο βάθος συλλογιστικής του μοντέλου, το οποίο πλέον χρησιμοποιεί περίπου 23.000 tokens ανά ερώτημα, σε σύγκριση με 12.000 στην προηγούμενη έκδοση.
Πέρα από τα μαθηματικά, το R1-0528 παρουσιάζει σημαντική άνοδο στην ικανότητα προγραμματισμού. Στην πρόκληση προγραμματισμού Codeforces, το μοντέλο πέτυχε βαθμολογία περίπου 1930, από 1530 προηγουμένως—μια βελτίωση 400 μονάδων που αντικατοπτρίζει ανώτερες δυνατότητες παραγωγής κώδικα και επίλυσης προβλημάτων. Η απόδοσή του σε ολοκληρωμένα τεστ προγραμματισμού έχει επίσης βελτιωθεί σημαντικά.
Η πρόοδος του μοντέλου ευθυγραμμίζεται με τα ευρήματα της Έκθεσης Δείκτη Τεχνητής Νοημοσύνης 2025 του Πανεπιστημίου Stanford, η οποία καταγράφει μια δραματική μείωση του χάσματος απόδοσης μεταξύ κορυφαίων αμερικανικών και κινεζικών μοντέλων AI. Σύμφωνα με την έκθεση, η διαφορά μεταξύ των κορυφαίων αμερικανικών και κινεζικών μοντέλων σε βασικά benchmarks μειώθηκε από διψήφια ποσοστά το 2023 σε σχεδόν ισοτιμία στις αρχές του 2025. Στον πίνακα κατάταξης Chatbot Arena, το χάσμα μεταξύ των κορυφαίων αμερικανικών και κινεζικών μοντέλων μειώθηκε από 9,26% τον Ιανουάριο του 2024 σε μόλις 1,70% τον Φεβρουάριο του 2025.
Οι ηγέτες του κλάδου έχουν παρατηρήσει αυτή τη μετατόπιση. Ο CEO της Nvidia, Jensen Huang, αναγνώρισε τον Μάιο ότι «η DeepSeek και το Qwen της [Alibaba] από την Κίνα είναι ανάμεσα στα καλύτερα open-source μοντέλα AI που έχουν κυκλοφορήσει ελεύθερα. Έχουν κερδίσει έδαφος στις ΗΠΑ, την Ευρώπη και πέρα από αυτές».
Το επίτευγμα της DeepSeek είναι ιδιαίτερα αξιοσημείωτο, καθώς προέρχεται από μια εταιρεία που ξεκίνησε ως σχετικά μικρή startup. Το μοντέλο διατίθεται με μια ευέλικτη άδεια χρήσης, τόσο στην πλήρη έκδοση όσο και σε μια μικρότερη «αποσταγμένη» παραλλαγή που μπορεί να λειτουργήσει σε λιγότερο ισχυρό υλικό, καθιστώντας τις προηγμένες δυνατότητες AI πιο προσιτές σε προγραμματιστές παγκοσμίως.