menu
close

Оновлення R1 від DeepSeek кидає виклик AI-гігантам завдяки покращеному міркуванню

Китайський стартап у сфері штучного інтелекту DeepSeek випустив R1-0528 — суттєве оновлення своєї відкритої моделі міркування, яка тепер конкурує з пропрієтарними рішеннями від OpenAI та Google. Оновлена модель демонструє значно вищу математичну точність, підвищивши результат з 70% до 87,5% на тесті AIME 2025 завдяки подвоєнню обсягу міркувань. DeepSeek також представила компактну дистильовану версію на 8 мільярдів параметрів, яку можна запускати на одній відеокарті без втрати продуктивності.
Оновлення R1 від DeepSeek кидає виклик AI-гігантам завдяки покращеному міркуванню

DeepSeek, китайський стартап у сфері штучного інтелекту, суттєво оновив свою відкриту модель міркування, випустивши R1-0528, що виводить її продуктивність майже на рівень лідерів галузі — OpenAI o3 та Google Gemini 2.5 Pro.

Оновлення стало значним кроком вперед у можливостях міркування DeepSeek завдяки збільшенню обчислювальних ресурсів і алгоритмічній оптимізації. У бенчмаркових тестах модель продемонструвала вражаючі покращення математичного міркування: точність на математичному тесті AIME 2025 зросла з 70% до 87,5%. Це стало можливим завдяки глибшому міркуванню — модель тепер використовує в середньому 23 000 токенів на питання замість попередніх 12 000.

Окрім математичних покращень, R1-0528 отримала низку нових функцій, які роблять її зручнішою для розробників. Модель тепер підтримує системні підказки, виклик функцій і вивід у форматі JSON, що спрощує інтеграцію в застосунки. Також зафіксовано зниження рівня галюцинацій — на 45–50% у завданнях переписування та узагальнення, а також покращену підтримку vibe coding, коли розробники можуть генерувати код за допомогою природної мови.

Для користувачів з обмеженими ресурсами DeepSeek також випустила дистильовану версію під назвою DeepSeek-R1-0528-Qwen3-8B. Вона створена шляхом донавчання моделі Alibaba Qwen3 8B на основі патернів міркування повної R1-0528. Ця компактна модель може працювати на одній споживчій відеокарті, при цьому перевершує Google Gemini 2.5 Flash на окремих математичних тестах і майже дорівнює Microsoft Phi 4 reasoning plus за рівнем міркування.

Як і попередниця, R1-0528 доступна за ліцензією MIT, що дозволяє комерційне використання та кастомізацію. Провідні хмарні провайдери, зокрема Amazon Web Services та Microsoft Azure, вже пропонують моделі DeepSeek своїм клієнтам, ізолюючи їх від китайських серверів для забезпечення приватності даних.

Цей реліз ще більше закріплює позиції DeepSeek і Meta як лідерів у сфері відкритого штучного інтелекту, пропонуючи потужні альтернативи пропрієтарним моделям від OpenAI, Google, Microsoft та Anthropic за значно менших обчислювальних витрат.

Source:

Latest News