DeepSeek, la startup china de inteligencia artificial que sacudió los mercados tecnológicos en enero con su innovador modelo R1, ha lanzado discretamente una actualización importante de su sistema insignia de IA.
La nueva versión, denominada DeepSeek-R1-0528, fue publicada el 28 de mayo con poca fanfarria a través de un breve anuncio en el grupo de WeChat de la empresa. A pesar de que DeepSeek la describe como una "actualización menor de prueba", las primeras pruebas revelan mejoras sustanciales en múltiples áreas.
Según el ranking de LiveCodeBench, el modelo actualizado ahora ocupa el cuarto lugar en capacidades de codificación con una puntuación Pass@1 de 73.1, situándose justo detrás de los modelos O3 y O4-Mini de OpenAI. Esto representa un avance importante para un modelo de código abierto, especialmente uno desarrollado con muchos menos recursos que sus homólogos occidentales.
Las especificaciones técnicas muestran que el R1-0528 mantiene la arquitectura Mixture-of-Experts (MoE) de su predecesor, con aproximadamente 685 mil millones de parámetros en total, aunque solo unos 37 mil millones están activos durante la inferencia. El modelo ahora soporta una ventana de contexto ampliada de hasta 128K tokens, lo que le permite procesar documentos y bases de código mucho más grandes.
Los comentarios de los usuarios destacan mejoras en la profundidad de razonamiento, calidad de redacción y capacidad de resolución de problemas. Los desarrolladores informan que el modelo ahora puede participar en sesiones de razonamiento extendidas de 30 a 60 minutos para tareas complejas, similar a los modelos de Google. La actualización también corrige peculiaridades previas en la generación de texto, produciendo contenido más natural y mejor formateado.
La continua innovación de DeepSeek desafía la idea de que escalar la IA requiere enormes recursos computacionales e inversión. El éxito de la empresa con modelos de código abierto y bajo costo ya ha obligado a los gigantes tecnológicos a responder: OpenAI ha reducido precios y Google ha introducido niveles de acceso con descuento. Mientras tanto, competidores chinos como Alibaba y Tencent han lanzado sus propios modelos que afirman superar las capacidades de DeepSeek.
La actualización R1-0528 está disponible en Hugging Face bajo una licencia MIT, lo que permite su uso comercial y modificaciones. Observadores de la industria anticipan que DeepSeek lanzará su modelo R2 más completo en los próximos meses, lo que podría alterar aún más el panorama de la IA.