DeepSeek усиливает ИИ Alibaba с помощью дистилляции знаний

Китайский стартап DeepSeek объявил 29 мая 2025 года, что улучшил базовую модель Alibaba Qwen 3 8B с помощью процесса дистилляции знаний, используя свою обновлённую модель рассуждений R1-0528. Благодаря дистилляции передовые возможности DeepSeek в области рассуждений были перенесены в модель Alibaba, что привело к увеличению производительности более чем на 10%. Это сотрудничество подчёркивает растущее влияние DeepSeek в секторе искусственного интеллекта и его стремление повышать эффективность моделей с помощью инновационных методов оптимизации.

Китайский стартап DeepSeek продолжает менять глобальный ландшафт искусственного интеллекта благодаря своим последним инновациям в области оптимизации моделей. 29 мая компания сообщила, что вариант её недавно обновлённой модели рассуждений R1-0528 был использован для улучшения базовой модели Alibaba Qwen 3 8B посредством процесса, известного как дистилляция.

Техника дистилляции, позволяющая передавать знания от более сложной модели к меньшей, дала DeepSeek возможность внедрить процессы рассуждения своей модели R1-0528 в систему Alibaba. По заявлению DeepSeek, этот процесс обеспечил прирост производительности модели Qwen 3 более чем на 10%.

«Мы считаем, что цепочка рассуждений DeepSeek-R1-0528 будет иметь большое значение как для академических исследований, так и для практических приложений», — говорится в заявлении компании. Ранее DeepSeek уже выпускала несколько дистиллированных моделей на базе архитектур Qwen и Llama от Meta, с размером от 1,5 до 70 миллиардов параметров.

Подход DeepSeek к разработке ИИ привлёк значительное внимание с января, когда её модель R1 продемонстрировала производительность, сопоставимую с решениями OpenAI и Google, при значительно меньших вычислительных затратах. Успех компании поставил под сомнение устоявшееся мнение о том, что передовой ИИ требует огромных вычислительных ресурсов и инвестиций.

Несмотря на ограничения США на экспорт передовых ИИ-чипов, DeepSeek оптимизировала свои модели для эффективной работы на менее мощном, разрешённом к экспорту оборудовании. Эта стратегия заставила конкурентов пересмотреть свою зависимость от аппаратного обеспечения и повлияла на динамику рынка в секторе искусственного интеллекта.

Последнее обновление R1-0528 приблизило модель DeepSeek к производительности моделей рассуждений OpenAI o3 и Google Gemini 2.5 Pro, обеспечив значительный прогресс в глубине рассуждений, возможностях вывода и снижении галлюцинаций. Постоянные инновации компании и её открытый подход меняют ожидания от разработки и внедрения ИИ-моделей.

Source:

DeepSeek усиливает ИИ Alibaba с помощью дистилляции знаний

Latest News

DeepSeek обновляет ИИ-модель R1 и бросает вызов западным технологическим гигантам

Google Beam: Революционные 3D-видеозвонки появятся в 2025 году

Google представляет Gemini 2.5 Deep Think на I/O 2025

AMD приобретает Enosemi для развития кремниевой фотоники в сфере ИИ

Уоррен требует от Пентагона обеспечить конкуренцию при заключении контрактов на ИИ на фоне растущего влияния Маска

Робот ATMO от Caltech трансформируется в воздухе для беспрепятственной работы на земле

Google представила Project Astra и AI Mode на I/O 2025

ИИ-системы превосходят людей в тестах на эмоциональный интеллект

Искусственный интеллект Doubao от ByteDance теперь предлагает помощь в реальном времени через видеосвязь

OnePlus отказывается от переключателя Alert Slider в пользу кнопки Plus Key с поддержкой ИИ

DeepSeek усиливает ИИ Alibaba с помощью дистилляции знаний

Related Articles

DeepSeek обновляет ИИ-модель R1 и бросает вызов западным технологическим гигантам

Google представляет Gemini 2.5 Deep Think на I/O 2025

AMD приобретает Enosemi для развития кремниевой фотоники в сфере ИИ

Уоррен требует от Пентагона обеспечить конкуренцию при заключении контрактов на ИИ на фоне растущего влияния Маска

Google представила Project Astra и AI Mode на I/O 2025

Latest News

DeepSeek обновляет ИИ-модель R1 и бросает вызов западным технологическим гигантам

Google Beam: Революционные 3D-видеозвонки появятся в 2025 году

Google представляет Gemini 2.5 Deep Think на I/O 2025

AMD приобретает Enosemi для развития кремниевой фотоники в сфере ИИ

Уоррен требует от Пентагона обеспечить конкуренцию при заключении контрактов на ИИ на фоне растущего влияния Маска

Робот ATMO от Caltech трансформируется в воздухе для беспрепятственной работы на земле

Google представила Project Astra и AI Mode на I/O 2025

ИИ-системы превосходят людей в тестах на эмоциональный интеллект

Искусственный интеллект Doubao от ByteDance теперь предлагает помощь в реальном времени через видеосвязь

OnePlus отказывается от переключателя Alert Slider в пользу кнопки Plus Key с поддержкой ИИ