Оновлення R1 від DeepSeek кидає виклик AI-гігантам завдяки покращеному міркуванню

Китайський стартап у сфері штучного інтелекту DeepSeek випустив R1-0528 — суттєве оновлення своєї відкритої моделі міркування, яка тепер конкурує з пропрієтарними рішеннями від OpenAI та Google. Оновлена модель демонструє значно вищу математичну точність, підвищивши результат з 70% до 87,5% на тесті AIME 2025 завдяки подвоєнню обсягу міркувань. DeepSeek також представила компактну дистильовану версію на 8 мільярдів параметрів, яку можна запускати на одній відеокарті без втрати продуктивності.

DeepSeek, китайський стартап у сфері штучного інтелекту, суттєво оновив свою відкриту модель міркування, випустивши R1-0528, що виводить її продуктивність майже на рівень лідерів галузі — OpenAI o3 та Google Gemini 2.5 Pro.

Оновлення стало значним кроком вперед у можливостях міркування DeepSeek завдяки збільшенню обчислювальних ресурсів і алгоритмічній оптимізації. У бенчмаркових тестах модель продемонструвала вражаючі покращення математичного міркування: точність на математичному тесті AIME 2025 зросла з 70% до 87,5%. Це стало можливим завдяки глибшому міркуванню — модель тепер використовує в середньому 23 000 токенів на питання замість попередніх 12 000.

Окрім математичних покращень, R1-0528 отримала низку нових функцій, які роблять її зручнішою для розробників. Модель тепер підтримує системні підказки, виклик функцій і вивід у форматі JSON, що спрощує інтеграцію в застосунки. Також зафіксовано зниження рівня галюцинацій — на 45–50% у завданнях переписування та узагальнення, а також покращену підтримку vibe coding, коли розробники можуть генерувати код за допомогою природної мови.

Для користувачів з обмеженими ресурсами DeepSeek також випустила дистильовану версію під назвою DeepSeek-R1-0528-Qwen3-8B. Вона створена шляхом донавчання моделі Alibaba Qwen3 8B на основі патернів міркування повної R1-0528. Ця компактна модель може працювати на одній споживчій відеокарті, при цьому перевершує Google Gemini 2.5 Flash на окремих математичних тестах і майже дорівнює Microsoft Phi 4 reasoning plus за рівнем міркування.

Як і попередниця, R1-0528 доступна за ліцензією MIT, що дозволяє комерційне використання та кастомізацію. Провідні хмарні провайдери, зокрема Amazon Web Services та Microsoft Azure, вже пропонують моделі DeepSeek своїм клієнтам, ізолюючи їх від китайських серверів для забезпечення приватності даних.

Цей реліз ще більше закріплює позиції DeepSeek і Meta як лідерів у сфері відкритого штучного інтелекту, пропонуючи потужні альтернативи пропрієтарним моделям від OpenAI, Google, Microsoft та Anthropic за значно менших обчислювальних витрат.

Source:

Оновлення R1 від DeepSeek кидає виклик AI-гігантам завдяки покращеному міркуванню

Latest News

Генеральний директор Nvidia відзначив глобальний вплив китайських AI-моделей

Google Flow: інструмент на базі ШІ змінює кіновиробництво завдяки технології Veo 3

Трамп відкликає кандидатуру керівника NASA на тлі бюджетної кризи та занепокоєння щодо стратегії ШІ

Anthropic досягає рубежу у $3 млрд доходу на тлі стрімкого зростання впровадження AI у бізнесі

Різниця між США та Китаєм у сфері ШІ різко скоротилася — Індекс ШІ Стенфорда 2025

Google презентує Gemini 2.5 із посиленою безпекою ШІ на I/O 2025

Baidu змінює стратегію: відкриє вихідний код Ernie AI для протидії зростаючій конкуренції

YouTube трансформує Shorts за допомогою Veo 2 від DeepMind для створення відео на основі ШІ

Grok 3.5 від Маска обіцяє революційні можливості штучного інтелекту в сфері логічного мислення

Google випускає Gemini 2.5 із покращеною безпекою та можливостями ШІ

Оновлення R1 від DeepSeek кидає виклик AI-гігантам завдяки покращеному міркуванню

Related Articles

Різниця між США та Китаєм у сфері ШІ різко скоротилася — Індекс ШІ Стенфорда 2025

Google презентує Gemini 2.5 із посиленою безпекою ШІ на I/O 2025

Grok 3.5 від Маска обіцяє революційні можливості штучного інтелекту в сфері логічного мислення

YouTube трансформує Shorts за допомогою Veo 2 від DeepMind для створення відео на основі ШІ

Baidu змінює стратегію: відкриє вихідний код Ernie AI для протидії зростаючій конкуренції

Latest News

Генеральний директор Nvidia відзначив глобальний вплив китайських AI-моделей

Google Flow: інструмент на базі ШІ змінює кіновиробництво завдяки технології Veo 3

Трамп відкликає кандидатуру керівника NASA на тлі бюджетної кризи та занепокоєння щодо стратегії ШІ

Anthropic досягає рубежу у $3 млрд доходу на тлі стрімкого зростання впровадження AI у бізнесі

Різниця між США та Китаєм у сфері ШІ різко скоротилася — Індекс ШІ Стенфорда 2025

Google презентує Gemini 2.5 із посиленою безпекою ШІ на I/O 2025

Baidu змінює стратегію: відкриє вихідний код Ernie AI для протидії зростаючій конкуренції

YouTube трансформує Shorts за допомогою Veo 2 від DeepMind для створення відео на основі ШІ

Grok 3.5 від Маска обіцяє революційні можливості штучного інтелекту в сфері логічного мислення

Google випускає Gemini 2.5 із покращеною безпекою та можливостями ШІ