DeepSeek, китайський стартап у сфері штучного інтелекту, суттєво оновив свою відкриту модель міркування, випустивши R1-0528, що виводить її продуктивність майже на рівень лідерів галузі — OpenAI o3 та Google Gemini 2.5 Pro.
Оновлення стало значним кроком вперед у можливостях міркування DeepSeek завдяки збільшенню обчислювальних ресурсів і алгоритмічній оптимізації. У бенчмаркових тестах модель продемонструвала вражаючі покращення математичного міркування: точність на математичному тесті AIME 2025 зросла з 70% до 87,5%. Це стало можливим завдяки глибшому міркуванню — модель тепер використовує в середньому 23 000 токенів на питання замість попередніх 12 000.
Окрім математичних покращень, R1-0528 отримала низку нових функцій, які роблять її зручнішою для розробників. Модель тепер підтримує системні підказки, виклик функцій і вивід у форматі JSON, що спрощує інтеграцію в застосунки. Також зафіксовано зниження рівня галюцинацій — на 45–50% у завданнях переписування та узагальнення, а також покращену підтримку vibe coding, коли розробники можуть генерувати код за допомогою природної мови.
Для користувачів з обмеженими ресурсами DeepSeek також випустила дистильовану версію під назвою DeepSeek-R1-0528-Qwen3-8B. Вона створена шляхом донавчання моделі Alibaba Qwen3 8B на основі патернів міркування повної R1-0528. Ця компактна модель може працювати на одній споживчій відеокарті, при цьому перевершує Google Gemini 2.5 Flash на окремих математичних тестах і майже дорівнює Microsoft Phi 4 reasoning plus за рівнем міркування.
Як і попередниця, R1-0528 доступна за ліцензією MIT, що дозволяє комерційне використання та кастомізацію. Провідні хмарні провайдери, зокрема Amazon Web Services та Microsoft Azure, вже пропонують моделі DeepSeek своїм клієнтам, ізолюючи їх від китайських серверів для забезпечення приватності даних.
Цей реліз ще більше закріплює позиції DeepSeek і Meta як лідерів у сфері відкритого штучного інтелекту, пропонуючи потужні альтернативи пропрієтарним моделям від OpenAI, Google, Microsoft та Anthropic за значно менших обчислювальних витрат.