A DeepSeek, uma startup chinesa de inteligência artificial, afirmou-se como um desafiante de peso ao domínio ocidental da IA com a atualização do seu mais recente modelo R1-0528, que agora apresenta desempenhos próximos dos líderes de mercado OpenAI e Google.
Apesar de a DeepSeek descrever esta atualização como uma "versão menor", o modelo apresenta melhorias substanciais em áreas-chave. No raciocínio matemático, a precisão do modelo no exigente teste AIME 2025 subiu de 70% para 87,5%, demonstrando capacidades de resolução de problemas significativamente reforçadas. Este avanço resulta de uma maior profundidade de raciocínio do modelo, que agora utiliza cerca de 23.000 tokens por consulta, em comparação com os 12.000 da versão anterior.
Para além da matemática, o R1-0528 revela progressos notórios na proficiência em programação. No desafio de programação Codeforces, o modelo alcançou uma classificação de aproximadamente 1930, face aos 1530 anteriores—uma melhoria de 400 pontos que reflete uma geração de código e capacidades de resolução de problemas superiores. O desempenho em testes de programação abrangentes também melhorou consideravelmente.
A evolução do modelo está em linha com as conclusões do AI Index Report 2025 da Universidade de Stanford, que documenta uma redução dramática da diferença de desempenho entre os principais modelos de IA dos EUA e da China. Segundo o relatório, a diferença entre os modelos americanos e chineses de topo nos principais benchmarks diminuiu de dois dígitos em 2023 para quase paridade no início de 2025. No Chatbot Arena Leaderboard, a diferença entre os melhores modelos dos EUA e da China passou de 9,26% em janeiro de 2024 para apenas 1,70% em fevereiro de 2025.
Os líderes da indústria têm vindo a reconhecer esta mudança. O CEO da Nvidia, Jensen Huang, reconheceu em maio que "a DeepSeek e a Qwen [da Alibaba], da China, estão entre os melhores modelos de IA open-source lançados livremente. Ganharam tração nos EUA, Europa e além".
O feito da DeepSeek é especialmente notável por provir de uma empresa que começou como uma startup relativamente pequena. O modelo está disponível sob uma licença permissiva, tanto na versão completa como numa variante "destilada" mais pequena, capaz de funcionar em hardware menos potente, tornando as capacidades avançadas de IA mais acessíveis a programadores em todo o mundo.