DeepSeek, китайски стартъп в сферата на изкуствения интелект, значително подобри своя отворен модел за разсъждение с пускането на R1-0528, доближавайки неговата производителност до тази на водещи индустриални решения като o3 на OpenAI и Gemini 2.5 Pro на Google.
Актуализацията представлява сериозен напредък във възможностите за разсъждение на DeepSeek чрез увеличени изчислителни ресурси и алгоритмична оптимизация. В бенчмарк тестове моделът показа забележителни подобрения в математическото разсъждение, като точността му на математическия тест AIME 2025 нарасна от 70% до 87,5%. Това подобрение се дължи на по-голяма дълбочина на разсъждение – моделът вече използва средно 23 000 токена на въпрос спрямо предишните 12 000.
Освен математическите подобрения, R1-0528 предлага и редица нови функции, които го правят по-удобен за разработчици. Моделът вече поддържа системни подсказки (system prompts), извикване на функции (function calling) и изход в JSON формат, което улеснява интеграцията му в приложения. Освен това демонстрира намалена честота на халюцинации – според данните с 45-50% по-малко при задачи за пренаписване и обобщаване – и по-добра поддръжка за vibe coding, при която разработчиците използват естествен език за генериране на код.
Важна новост за потребителите с ограничени ресурси е и дестилираната версия DeepSeek-R1-0528-Qwen3-8B. Тя е създадена чрез фино настройване на модела Qwen3 8B на Alibaba с шаблони за разсъждение от пълния R1-0528. Този по-малък модел може да работи на една потребителска GPU карта, като въпреки това надминава Gemini 2.5 Flash на Google в определени математически тестове и почти достига нивото на Phi 4 reasoning plus на Microsoft.
Както и предшественика си, R1-0528 се предлага под свободния MIT лиценз, позволяващ комерсиална употреба и персонализация. Големи облачни доставчици като Amazon Web Services и Microsoft Azure вече предлагат моделите на DeepSeek на своите клиенти, като ги изолират от китайски сървъри с цел гарантиране на поверителността на данните.
Това издание допълнително затвърждава позициите на DeepSeek и Meta като лидери в сферата на отворения AI, предоставяйки мощни алтернативи на затворените модели на OpenAI, Google, Microsoft и Anthropic при значително по-ниски изчислителни разходи.