Η DeepSeek, η κινεζική startup τεχνητής νοημοσύνης που προκάλεσε πτώση των τεχνολογικών μετοχών τον Ιανουάριο με το πρωτοποριακό της μοντέλο R1, προχώρησε αθόρυβα σε μια σημαντική αναβάθμιση του βασικού της συστήματος AI.
Η νέα έκδοση, με την ονομασία DeepSeek-R1-0528, κυκλοφόρησε στις 28 Μαΐου μέσω μιας σύντομης ανακοίνωσης στην ομάδα WeChat της εταιρείας. Παρά το γεγονός ότι η DeepSeek τη χαρακτήρισε ως «μικρή δοκιμαστική αναβάθμιση», οι πρώτες δοκιμές αποκαλύπτουν ουσιαστικές βελτιώσεις σε πολλούς τομείς.
Σύμφωνα με τον πίνακα κατάταξης LiveCodeBench, το αναβαθμισμένο μοντέλο κατατάσσεται πλέον τέταρτο στις δυνατότητες προγραμματισμού με Pass@1 σκορ 73,1, ακριβώς πίσω από τα μοντέλα O3 και O4-Mini της OpenAI. Αυτό αποτελεί σημαντικό άλμα για ένα μοντέλο ανοιχτού κώδικα, ειδικά δεδομένου ότι αναπτύχθηκε με πολύ λιγότερους πόρους από τους δυτικούς ανταγωνιστές του.
Τα τεχνικά χαρακτηριστικά δείχνουν ότι το R1-0528 διατηρεί την αρχιτεκτονική Mixture-of-Experts (MoE) του προκατόχου του, με περίπου 685 δισεκατομμύρια παραμέτρους συνολικά, αν και μόνο περίπου 37 δισεκατομμύρια είναι ενεργές κατά την εκτέλεση. Το μοντέλο πλέον υποστηρίζει διευρυμένο παράθυρο συμφραζομένων έως και 128K tokens, επιτρέποντάς του να επεξεργάζεται πολύ μεγαλύτερα έγγραφα και βάσεις κώδικα.
Τα σχόλια των χρηστών αναδεικνύουν βελτιώσεις στο βάθος λογικής, την ποιότητα συγγραφής και τις ικανότητες επίλυσης προβλημάτων. Οι προγραμματιστές αναφέρουν ότι το μοντέλο μπορεί πλέον να συμμετέχει σε εκτεταμένες συνεδρίες λογικής διάρκειας 30-60 λεπτών για σύνθετα καθήκοντα, παρόμοια με τα μοντέλα της Google. Η αναβάθμιση επίσης αντιμετωπίζει προηγούμενες ιδιορρυθμίες στη δημιουργία κειμένου, παράγοντας πιο φυσικό και καλύτερα μορφοποιημένο περιεχόμενο.
Η συνεχής καινοτομία της DeepSeek αμφισβητεί την αντίληψη ότι η κλιμάκωση της τεχνητής νοημοσύνης απαιτεί τεράστια υπολογιστική ισχύ και επενδύσεις. Η επιτυχία της εταιρείας με οικονομικά αποδοτικά μοντέλα ανοιχτού κώδικα έχει ήδη προκαλέσει αντιδράσεις από τεχνολογικούς κολοσσούς, με την OpenAI να μειώνει τιμές και τη Google να εισάγει φθηνότερες βαθμίδες πρόσβασης. Παράλληλα, Κινέζοι ανταγωνιστές όπως η Alibaba και η Tencent έχουν κυκλοφορήσει δικά τους μοντέλα, ισχυριζόμενοι ότι ξεπερνούν τις δυνατότητες της DeepSeek.
Η αναβάθμιση R1-0528 είναι διαθέσιμη στο Hugging Face υπό την άδεια MIT, επιτρέποντας εμπορική χρήση και τροποποιήσεις. Οι αναλυτές της αγοράς αναμένουν ότι η DeepSeek θα κυκλοφορήσει το πιο ολοκληρωμένο μοντέλο R2 τους επόμενους μήνες, ενδεχομένως προκαλώντας περαιτέρω αναταράξεις στον χώρο της τεχνητής νοημοσύνης.