Китайский стартап в области искусственного интеллекта DeepSeek, который в январе потряс технологический рынок своей революционной моделью R1, тихо выпустил значительное обновление своей флагманской ИИ-системы.
Новая версия, получившая название DeepSeek-R1-0528, была представлена 28 мая без широкой огласки — лишь кратким объявлением в корпоративной группе WeChat. Несмотря на то, что DeepSeek называет обновление «незначительным пробным апгрейдом», первые тесты показывают значительный прогресс по ряду направлений.
Согласно рейтингу LiveCodeBench, обновлённая модель теперь занимает четвёртое место по возможностям программирования с показателем Pass@1 на уровне 73,1, уступая лишь моделям O3 и O4-Mini от OpenAI. Это серьёзный прорыв для открытой модели, особенно учитывая, что она создана с куда меньшими ресурсами, чем западные аналоги.
Технические характеристики R1-0528 унаследованы от предыдущей версии: архитектура Mixture-of-Experts (MoE), общее количество параметров — около 685 миллиардов, из которых только 37 миллиардов активны во время инференса. Теперь модель поддерживает расширенное контекстное окно до 128 тысяч токенов, что позволяет ей обрабатывать гораздо более крупные документы и кодовые базы.
Пользовательские отзывы отмечают улучшения в глубине рассуждений, качестве письма и способности к решению задач. Разработчики сообщают, что модель теперь способна вести длительные сессии рассуждений продолжительностью 30–60 минут для сложных задач, что сопоставимо с моделями Google. Обновление также устранило прежние недостатки генерации текста — теперь контент выглядит более естественным и структурированным.
Постоянные инновации DeepSeek ставят под сомнение мнение о том, что масштабирование ИИ требует колоссальных вычислительных мощностей и инвестиций. Успех компании с экономичными open-source моделями уже вынудил технологических гигантов реагировать: OpenAI снизила цены, а Google ввела льготные тарифы на доступ. Тем временем китайские конкуренты, такие как Alibaba и Tencent, представили собственные модели, заявляя о превосходстве над DeepSeek.
Обновление R1-0528 доступно на платформе Hugging Face под лицензией MIT, что позволяет использовать и модифицировать модель в коммерческих целях. Эксперты отрасли ожидают, что в ближайшие месяцы DeepSeek представит более продвинутую модель R2, что может привести к новым переменам на рынке ИИ.