DeepSeek, китайский стартап в области искусственного интеллекта, утвердился в роли серьёзного конкурента западному доминированию в ИИ благодаря последнему обновлению своей модели R1-0528, которая теперь по производительности приближается к лидерам отрасли — OpenAI и Google.
Несмотря на то, что DeepSeek называет обновление «минорным», оно принесло значительные улучшения по ключевым направлениям. В области математического мышления точность модели на сложном тесте AIME 2025 выросла с 70% до 87,5%, что свидетельствует о возросших способностях к решению задач. Такой прогресс обеспечен увеличением глубины рассуждений модели: теперь она использует примерно 23 000 токенов на запрос против 12 000 в предыдущей версии.
Помимо математики, R1-0528 значительно улучшила навыки программирования. На платформе Codeforces рейтинг модели вырос примерно до 1930 баллов против прежних 1530 — прирост на 400 пунктов отражает более высокое качество генерации кода и решения задач. Также существенно улучшились результаты на комплексных тестах по программированию.
Достижения модели соответствуют выводам Индекса ИИ Стэнфордского университета за 2025 год, где отмечается резкое сокращение разрыва между ведущими американскими и китайскими ИИ-моделями. Согласно отчёту, разница между топовыми моделями США и Китая на ключевых бенчмарках сократилась с двузначных значений в 2023 году до почти полного паритета к началу 2025-го. На рейтинговой платформе Chatbot Arena разрыв между лучшими американскими и китайскими моделями уменьшился с 9,26% в январе 2024 года до всего 1,70% к февралю 2025-го.
Лидеры отрасли обратили внимание на эти изменения. Генеральный директор Nvidia Дженсен Хуанг в мае отметил: «DeepSeek и Qwen от [Alibaba] из Китая — одни из лучших открытых моделей ИИ, свободно распространяемых. Они получили широкое распространение в США, Европе и за их пределами».
Особенно примечательно, что DeepSeek добилась такого успеха, начав как относительно небольшой стартап. Модель распространяется по свободной лицензии, доступна как в полной версии, так и в облегчённом «дистиллированном» варианте, который может работать на менее мощном оборудовании, что делает передовые ИИ-возможности более доступными для разработчиков по всему миру.