DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

La startup china de inteligencia artificial DeepSeek anunció el 29 de mayo de 2025 que ha mejorado el modelo Qwen 3 8B Base de Alibaba a través de un proceso de destilación de conocimiento utilizando su modelo de razonamiento actualizado R1-0528. Esta técnica transfirió las avanzadas capacidades de razonamiento de DeepSeek al modelo de Alibaba, logrando mejoras de rendimiento superiores al 10%. Esta colaboración destaca la creciente influencia de DeepSeek en el sector de la IA y su compromiso con la eficiencia de los modelos mediante enfoques innovadores de optimización.

La startup china de inteligencia artificial DeepSeek continúa revolucionando el panorama global de la IA con su más reciente innovación en optimización de modelos. El 29 de mayo, la empresa reveló que una variante de su modelo de razonamiento actualizado R1-0528 fue utilizada para mejorar el modelo Qwen 3 8B Base de Alibaba mediante un proceso conocido como destilación.

La técnica de destilación, que transfiere el conocimiento de un modelo más sofisticado a uno más pequeño, permitió a DeepSeek impartir los procesos de razonamiento de su modelo R1-0528 al sistema de Alibaba. Según el anuncio de DeepSeek, este proceso resultó en mejoras de rendimiento superiores al 10% para el modelo Qwen 3.

"Creemos que la cadena de razonamiento de DeepSeek-R1-0528 tendrá una importancia significativa tanto para la investigación académica como para aplicaciones prácticas", afirmó DeepSeek en su comunicado. La empresa ha lanzado previamente varios modelos destilados basados tanto en las arquitecturas Qwen como en Llama de Meta, con tamaños que van desde 1.5B hasta 70B parámetros.

El enfoque de DeepSeek para el desarrollo de IA ha llamado la atención desde enero, cuando su modelo R1 demostró un rendimiento comparable al de las ofertas de OpenAI y Google, pero a una fracción del costo computacional. El éxito de la compañía ha desafiado la creencia predominante de que la IA de vanguardia requiere enormes recursos computacionales e inversión.

A pesar de enfrentar restricciones de exportación de chips avanzados de IA por parte de Estados Unidos, DeepSeek ha optimizado sus modelos para funcionar eficientemente en hardware de menor potencia y aprobado para exportación. Esta estrategia ha obligado a los competidores a reconsiderar su dependencia de hardware y ha influido en la dinámica del mercado en el sector de la IA.

La última actualización R1-0528 acerca el modelo de DeepSeek al rendimiento de los modelos de razonamiento o3 de OpenAI y Gemini 2.5 Pro de Google, con mejoras significativas en profundidad de razonamiento, capacidades de inferencia y reducción de alucinaciones. La continua innovación de la empresa y su enfoque de código abierto están redefiniendo las expectativas sobre el desarrollo y la eficiencia en el despliegue de modelos de IA.

Source:

DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

Latest News

DeepSeek mejora su modelo de IA R1 y desafía a los gigantes tecnológicos occidentales

Google Beam: Llamadas 3D revolucionarias llegarán en 2025

Google presenta Gemini 2.5 Deep Think en I/O 2025

AMD adquiere Enosemi para impulsar la fotónica de silicio en IA

Warren exige que el Pentágono garantice competencia en contratos de IA ante la creciente influencia de Musk

El robot ATMO de Caltech se transforma en el aire para operaciones terrestres sin interrupciones

Google presenta Project Astra y Modo IA en el I/O 2025

Sistemas de IA superan a los humanos en pruebas de inteligencia emocional

Doubao AI de ByteDance ahora ofrece asistencia en video en tiempo real

OnePlus reemplaza el Alert Slider por el nuevo Plus Key impulsado por IA

DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

Related Articles

DeepSeek mejora su modelo de IA R1 y desafía a los gigantes tecnológicos occidentales

Google presenta Gemini 2.5 Deep Think en I/O 2025

AMD adquiere Enosemi para impulsar la fotónica de silicio en IA

Warren exige que el Pentágono garantice competencia en contratos de IA ante la creciente influencia de Musk

Google presenta Project Astra y Modo IA en el I/O 2025

Latest News

DeepSeek mejora su modelo de IA R1 y desafía a los gigantes tecnológicos occidentales

Google Beam: Llamadas 3D revolucionarias llegarán en 2025

Google presenta Gemini 2.5 Deep Think en I/O 2025

AMD adquiere Enosemi para impulsar la fotónica de silicio en IA

Warren exige que el Pentágono garantice competencia en contratos de IA ante la creciente influencia de Musk

El robot ATMO de Caltech se transforma en el aire para operaciones terrestres sin interrupciones

Google presenta Project Astra y Modo IA en el I/O 2025

Sistemas de IA superan a los humanos en pruebas de inteligencia emocional

Doubao AI de ByteDance ahora ofrece asistencia en video en tiempo real

OnePlus reemplaza el Alert Slider por el nuevo Plus Key impulsado por IA