DeepSeek, китайський стартап у сфері штучного інтелекту, утвердився як серйозний конкурент західному домінуванню в AI завдяки останньому оновленню моделі R1-0528, яка тепер працює майже на рівні лідерів галузі — OpenAI та Google.
Оновлена модель, яку в DeepSeek називають «незначним оновленням версії», насправді демонструє суттєвий прогрес у ключових можливостях. Зокрема, у математичному мисленні точність на складному тесті AIME 2025 зросла з 70% до 87,5%, що свідчить про покращені навички розв’язання задач. Це стало можливим завдяки глибшому рівню міркувань моделі: тепер вона використовує близько 23 000 токенів на запит замість 12 000 у попередній версії.
Окрім математики, R1-0528 суттєво покращила свої програмістські здібності. На змаганні з програмування Codeforces модель отримала рейтинг близько 1930, що на 400 пунктів більше, ніж раніше (1530), — це свідчить про значне зростання якості генерації коду та розв’язання задач. Значно покращилися й результати на комплексних тестах з програмування.
Прогрес моделі відповідає висновкам AI Index Report 2025 Стенфордського університету, де зафіксовано різке скорочення розриву між провідними американськими та китайськими AI-моделями. Згідно зі звітом, різниця між лідируючими моделями США та Китаю на основних бенчмарках скоротилася з двозначних відсотків у 2023 році до майже нульової на початку 2025-го. На Chatbot Arena Leaderboard розрив між топ-моделями США та Китаю зменшився з 9,26% у січні 2024 року до лише 1,70% у лютому 2025-го.
Лідери індустрії вже звернули увагу на ці зміни. Генеральний директор Nvidia Дженсен Хуанг у травні зазначив: «DeepSeek і Qwen від [Alibaba] з Китаю — одні з найкращих відкритих AI-моделей, які вільно доступні. Вони набирають популярності у США, Європі та за їх межами».
Досягнення DeepSeek особливо вражає, враховуючи, що компанія починала як відносно невеликий стартап. Модель доступна за ліберальною ліцензією — як у повній версії, так і в компактнішому «дистильованому» варіанті, який може працювати на менш потужному обладнанні. Це робить передові можливості AI доступнішими для розробників у всьому світі.