menu
close

DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

La startup china de inteligencia artificial DeepSeek anunció el 29 de mayo de 2025 que ha mejorado el modelo Qwen 3 8B Base de Alibaba a través de un proceso de destilación de conocimiento utilizando su modelo de razonamiento actualizado R1-0528. Esta técnica transfirió las avanzadas capacidades de razonamiento de DeepSeek al modelo de Alibaba, logrando mejoras de rendimiento superiores al 10%. Esta colaboración destaca la creciente influencia de DeepSeek en el sector de la IA y su compromiso con la eficiencia de los modelos mediante enfoques innovadores de optimización.
DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

La startup china de inteligencia artificial DeepSeek continúa revolucionando el panorama global de la IA con su más reciente innovación en optimización de modelos. El 29 de mayo, la empresa reveló que una variante de su modelo de razonamiento actualizado R1-0528 fue utilizada para mejorar el modelo Qwen 3 8B Base de Alibaba mediante un proceso conocido como destilación.

La técnica de destilación, que transfiere el conocimiento de un modelo más sofisticado a uno más pequeño, permitió a DeepSeek impartir los procesos de razonamiento de su modelo R1-0528 al sistema de Alibaba. Según el anuncio de DeepSeek, este proceso resultó en mejoras de rendimiento superiores al 10% para el modelo Qwen 3.

"Creemos que la cadena de razonamiento de DeepSeek-R1-0528 tendrá una importancia significativa tanto para la investigación académica como para aplicaciones prácticas", afirmó DeepSeek en su comunicado. La empresa ha lanzado previamente varios modelos destilados basados tanto en las arquitecturas Qwen como en Llama de Meta, con tamaños que van desde 1.5B hasta 70B parámetros.

El enfoque de DeepSeek para el desarrollo de IA ha llamado la atención desde enero, cuando su modelo R1 demostró un rendimiento comparable al de las ofertas de OpenAI y Google, pero a una fracción del costo computacional. El éxito de la compañía ha desafiado la creencia predominante de que la IA de vanguardia requiere enormes recursos computacionales e inversión.

A pesar de enfrentar restricciones de exportación de chips avanzados de IA por parte de Estados Unidos, DeepSeek ha optimizado sus modelos para funcionar eficientemente en hardware de menor potencia y aprobado para exportación. Esta estrategia ha obligado a los competidores a reconsiderar su dependencia de hardware y ha influido en la dinámica del mercado en el sector de la IA.

La última actualización R1-0528 acerca el modelo de DeepSeek al rendimiento de los modelos de razonamiento o3 de OpenAI y Gemini 2.5 Pro de Google, con mejoras significativas en profundidad de razonamiento, capacidades de inferencia y reducción de alucinaciones. La continua innovación de la empresa y su enfoque de código abierto están redefiniendo las expectativas sobre el desarrollo y la eficiencia en el despliegue de modelos de IA.

Source:

Latest News