menu
close

Обновление R1 от DeepSeek бросает вызов гигантам ИИ благодаря улучшенному рассуждению

Китайский стартап DeepSeek выпустил R1-0528 — значительное обновление своей открытой модели рассуждения, которая теперь соперничает с проприетарными решениями OpenAI и Google. Улучшенная модель демонстрирует резкий рост математической точности, увеличив результат на тесте AIME 2025 с 70% до 87,5% за счет удвоения глубины рассуждений. DeepSeek также представила компактную дистиллированную версию на 8 млрд параметров, способную работать на одной видеокарте без существенной потери производительности.
Обновление R1 от DeepSeek бросает вызов гигантам ИИ благодаря улучшенному рассуждению

Китайский стартап в сфере искусственного интеллекта DeepSeek существенно улучшил свою открытую модель рассуждения, выпустив версию R1-0528, которая по производительности приблизилась к лидерам отрасли — таким как o3 от OpenAI и Gemini 2.5 Pro от Google.

Это обновление стало значительным шагом вперед для DeepSeek благодаря увеличению вычислительных ресурсов и оптимизации алгоритмов. В тестах на математическое рассуждение модель показала впечатляющий прогресс: точность на экзамене AIME 2025 выросла с 70% до 87,5%. Такой скачок объясняется увеличением глубины рассуждений — теперь модель использует в среднем 23 000 токенов на вопрос против прежних 12 000.

Помимо математических улучшений, R1-0528 получила ряд новых функций, делающих ее более удобной для разработчиков. Модель теперь поддерживает системные подсказки, вызов функций и вывод в формате JSON, что облегчает интеграцию в приложения. Также отмечено значительное снижение уровня галлюцинаций — на 45–50% в задачах переписывания и суммаризации, а поддержка генерации кода на естественном языке (vibe coding) стала еще лучше.

Для пользователей с ограниченными ресурсами DeepSeek выпустила дистиллированную версию DeepSeek-R1-0528-Qwen3-8B. Она создана путем дообучения модели Qwen3 8B от Alibaba на паттернах рассуждений полной R1-0528. Эта компактная модель способна работать на одной потребительской видеокарте, при этом превосходит Gemini 2.5 Flash от Google по ряду математических бенчмарков и почти догоняет Phi 4 reasoning plus от Microsoft.

Как и предшественник, R1-0528 распространяется под свободной лицензией MIT, что позволяет использовать и модифицировать модель в коммерческих целях. Крупнейшие облачные провайдеры, включая Amazon Web Services и Microsoft Azure, уже предлагают модели DeepSeek своим клиентам, при этом изолируя их от китайских серверов для обеспечения приватности данных.

Этот релиз еще больше укрепляет позиции DeepSeek и Meta как лидеров в области открытого ИИ, предоставляя мощную альтернативу проприетарным решениям OpenAI, Google, Microsoft и Anthropic при значительно меньших вычислительных затратах.

Source:

Latest News