DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

La startup china de inteligencia artificial DeepSeek anunció el 29 de mayo de 2025 que ha mejorado el modelo Qwen 3 8B Base de Alibaba a través de un proceso de destilación de conocimiento utilizando su modelo de razonamiento actualizado R1-0528. Esta técnica de destilación transfirió las avanzadas capacidades de razonamiento de DeepSeek al modelo de Alibaba, logrando mejoras de rendimiento superiores al 10%. Esta colaboración pone de relieve la creciente influencia de DeepSeek en el sector de la IA y su compromiso con la eficiencia de los modelos mediante enfoques innovadores de optimización.

La startup china de inteligencia artificial DeepSeek sigue revolucionando el panorama global de la IA con su última innovación en optimización de modelos. El 29 de mayo, la empresa reveló que una variante de su recientemente actualizado modelo de razonamiento R1-0528 se utilizó para mejorar el modelo Qwen 3 8B Base de Alibaba mediante un proceso conocido como destilación.

La técnica de destilación, que transfiere el conocimiento de un modelo más sofisticado a uno más pequeño, permitió a DeepSeek trasladar los procesos de razonamiento de su modelo R1-0528 al sistema de Alibaba. Según el anuncio de DeepSeek, este proceso resultó en mejoras de rendimiento superiores al 10% para el modelo Qwen 3.

"Creemos que la cadena de razonamiento de DeepSeek-R1-0528 tendrá una importancia significativa tanto para la investigación académica como para las aplicaciones prácticas", afirmó DeepSeek en su comunicado. La empresa ya ha lanzado previamente varios modelos destilados basados tanto en las arquitecturas Qwen como en Llama de Meta, con tamaños que van desde 1,5B hasta 70B parámetros.

El enfoque de DeepSeek en el desarrollo de IA ha atraído una atención considerable desde enero, cuando su modelo R1 demostró un rendimiento comparable al de las ofertas de OpenAI y Google, pero a una fracción del coste computacional. El éxito de la compañía ha puesto en entredicho la idea de que la IA de vanguardia requiere enormes recursos informáticos e inversión.

A pesar de las restricciones estadounidenses a la exportación de chips avanzados de IA, DeepSeek ha optimizado sus modelos para funcionar de manera eficiente en hardware de bajo consumo y aprobado para exportación. Esta estrategia ha obligado a los competidores a replantearse su dependencia del hardware y ha influido en la dinámica del mercado del sector de la IA.

La última actualización R1-0528 acerca el modelo de DeepSeek al rendimiento de los modelos de razonamiento o3 de OpenAI y Gemini 2.5 Pro de Google, con mejoras significativas en profundidad de razonamiento, capacidades de inferencia y reducción de alucinaciones. La continua innovación de la empresa y su enfoque de código abierto están redefiniendo las expectativas sobre el desarrollo y la eficiencia en el despliegue de modelos de IA.

Source:

DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

Latest News

DeepSeek actualiza su modelo de IA R1 y desafía a los gigantes tecnológicos occidentales

Google Beam: Las videollamadas 3D revolucionarias llegarán en 2025

Google presenta Gemini 2.5 Deep Think en el I/O 2025

AMD adquiere Enosemi para impulsar la fotónica de silicio en la IA

Warren exige al Pentágono garantizar la competencia en contratos de IA ante la creciente influencia de Musk

El robot ATMO de Caltech se transforma en pleno vuelo para operar sin interrupciones en tierra

Google presenta Project Astra y el Modo IA en el I/O 2025

Los sistemas de IA superan a los humanos en pruebas de inteligencia emocional

Doubao AI de ByteDance ahora ofrece asistencia en vídeo en tiempo real

OnePlus sustituye el Alert Slider por la nueva tecla Plus impulsada por IA

DeepSeek impulsa la IA de Alibaba mediante destilación de conocimiento

Related Articles

DeepSeek actualiza su modelo de IA R1 y desafía a los gigantes tecnológicos occidentales

Google presenta Gemini 2.5 Deep Think en el I/O 2025

AMD adquiere Enosemi para impulsar la fotónica de silicio en la IA

Warren exige al Pentágono garantizar la competencia en contratos de IA ante la creciente influencia de Musk

Google presenta Project Astra y el Modo IA en el I/O 2025

Latest News

DeepSeek actualiza su modelo de IA R1 y desafía a los gigantes tecnológicos occidentales

Google Beam: Las videollamadas 3D revolucionarias llegarán en 2025

Google presenta Gemini 2.5 Deep Think en el I/O 2025

AMD adquiere Enosemi para impulsar la fotónica de silicio en la IA

Warren exige al Pentágono garantizar la competencia en contratos de IA ante la creciente influencia de Musk

El robot ATMO de Caltech se transforma en pleno vuelo para operar sin interrupciones en tierra

Google presenta Project Astra y el Modo IA en el I/O 2025

Los sistemas de IA superan a los humanos en pruebas de inteligencia emocional

Doubao AI de ByteDance ahora ofrece asistencia en vídeo en tiempo real

OnePlus sustituye el Alert Slider por la nueva tecla Plus impulsada por IA