Актуализацията R1 на DeepSeek предизвиква AI гигантите с подобрени възможности за разсъждение

Китайският AI стартъп DeepSeek пусна R1-0528 – значителна актуализация на своя отворен модел за разсъждение, която вече съперничи на затворените решения на OpenAI и Google. Подобреният модел демонстрира драматично повишена математическа точност, скачайки от 70% на 87,5% в теста AIME 2025 чрез удвояване на капацитета за разсъждение. DeepSeek пусна и по-малка, дестилирана версия с 8 милиарда параметъра, която може да работи на една GPU карта, като същевременно запазва впечатляваща производителност.

DeepSeek, китайски стартъп в сферата на изкуствения интелект, значително подобри своя отворен модел за разсъждение с пускането на R1-0528, доближавайки неговата производителност до тази на водещи индустриални решения като o3 на OpenAI и Gemini 2.5 Pro на Google.

Актуализацията представлява сериозен напредък във възможностите за разсъждение на DeepSeek чрез увеличени изчислителни ресурси и алгоритмична оптимизация. В бенчмарк тестове моделът показа забележителни подобрения в математическото разсъждение, като точността му на математическия тест AIME 2025 нарасна от 70% до 87,5%. Това подобрение се дължи на по-голяма дълбочина на разсъждение – моделът вече използва средно 23 000 токена на въпрос спрямо предишните 12 000.

Освен математическите подобрения, R1-0528 предлага и редица нови функции, които го правят по-удобен за разработчици. Моделът вече поддържа системни подсказки (system prompts), извикване на функции (function calling) и изход в JSON формат, което улеснява интеграцията му в приложения. Освен това демонстрира намалена честота на халюцинации – според данните с 45-50% по-малко при задачи за пренаписване и обобщаване – и по-добра поддръжка за vibe coding, при която разработчиците използват естествен език за генериране на код.

Важна новост за потребителите с ограничени ресурси е и дестилираната версия DeepSeek-R1-0528-Qwen3-8B. Тя е създадена чрез фино настройване на модела Qwen3 8B на Alibaba с шаблони за разсъждение от пълния R1-0528. Този по-малък модел може да работи на една потребителска GPU карта, като въпреки това надминава Gemini 2.5 Flash на Google в определени математически тестове и почти достига нивото на Phi 4 reasoning plus на Microsoft.

Както и предшественика си, R1-0528 се предлага под свободния MIT лиценз, позволяващ комерсиална употреба и персонализация. Големи облачни доставчици като Amazon Web Services и Microsoft Azure вече предлагат моделите на DeepSeek на своите клиенти, като ги изолират от китайски сървъри с цел гарантиране на поверителността на данните.

Това издание допълнително затвърждава позициите на DeepSeek и Meta като лидери в сферата на отворения AI, предоставяйки мощни алтернативи на затворените модели на OpenAI, Google, Microsoft и Anthropic при значително по-ниски изчислителни разходи.

Source:

Актуализацията R1 на DeepSeek предизвиква AI гигантите с подобрени възможности за разсъждение

Latest News

Главният изпълнителен директор на Nvidia похвали глобалното влияние на китайските AI модели

Google Flow: AI инструментът, който преобразява киното с технологията Veo 3

Тръмп оттегля номинацията за ръководител на НАСА на фона на бюджетна криза и опасения за AI стратегията

Anthropic достига $3 млрд. приходи на фона на бум в корпоративното внедряване на AI

Разликата между САЩ и Китай в изкуствения интелект рязко се стеснява според индекса на Станфорд за 2025 г.

Google представи Gemini 2.5 с подобрена AI сигурност на I/O 2025

Baidu променя стратегията си, ще направи Ernie AI с отворен код в отговор на нарастващата конкуренция

YouTube трансформира Shorts с AI видео създаване чрез Veo 2 на DeepMind

Grok 3.5 на Мъск обещава революционни възможности за AI разсъждение

Google пуска Gemini 2.5 с подобрена сигурност и AI възможности

Актуализацията R1 на DeepSeek предизвиква AI гигантите с подобрени възможности за разсъждение

Related Articles

Разликата между САЩ и Китай в изкуствения интелект рязко се стеснява според индекса на Станфорд за 2025 г.

Google представи Gemini 2.5 с подобрена AI сигурност на I/O 2025

Grok 3.5 на Мъск обещава революционни възможности за AI разсъждение

YouTube трансформира Shorts с AI видео създаване чрез Veo 2 на DeepMind

Baidu променя стратегията си, ще направи Ernie AI с отворен код в отговор на нарастващата конкуренция

Latest News

Главният изпълнителен директор на Nvidia похвали глобалното влияние на китайските AI модели

Google Flow: AI инструментът, който преобразява киното с технологията Veo 3

Тръмп оттегля номинацията за ръководител на НАСА на фона на бюджетна криза и опасения за AI стратегията

Anthropic достига $3 млрд. приходи на фона на бум в корпоративното внедряване на AI

Разликата между САЩ и Китай в изкуствения интелект рязко се стеснява според индекса на Станфорд за 2025 г.

Google представи Gemini 2.5 с подобрена AI сигурност на I/O 2025

Baidu променя стратегията си, ще направи Ernie AI с отворен код в отговор на нарастващата конкуренция

YouTube трансформира Shorts с AI видео създаване чрез Veo 2 на DeepMind

Grok 3.5 на Мъск обещава революционни възможности за AI разсъждение

Google пуска Gemini 2.5 с подобрена сигурност и AI възможности