A DeepSeek, startup chinesa de inteligência artificial, aprimorou significativamente seu modelo de raciocínio open source com o lançamento do R1-0528, aproximando seu desempenho dos líderes do setor, como o o3 da OpenAI e o Gemini 2.5 Pro do Google.
A atualização representa um grande avanço nas capacidades de raciocínio da DeepSeek, graças ao aumento dos recursos computacionais e à otimização algorítmica. Em testes de benchmark, o modelo apresentou melhorias notáveis em raciocínio matemático, com a precisão no teste de matemática AIME 2025 subindo de 70% para 87,5%. Esse avanço decorre do aumento da profundidade de raciocínio, com o modelo agora utilizando em média 23.000 tokens por questão, em comparação com os 12.000 anteriores.
Além das melhorias matemáticas, o R1-0528 oferece diversos recursos aprimorados que o tornam mais amigável para desenvolvedores. O modelo agora suporta prompts de sistema, chamadas de função e saída em JSON, facilitando sua integração em aplicações. Também apresenta uma taxa de alucinação reduzida — supostamente entre 45% e 50% menor em tarefas de reescrita e sumarização — e oferece melhor suporte ao vibe coding, permitindo que desenvolvedores gerem código a partir de linguagem natural.
Em um avanço importante para usuários com recursos limitados, a DeepSeek também lançou uma versão destilada chamada DeepSeek-R1-0528-Qwen3-8B. Criada a partir do ajuste fino do modelo Qwen3 8B da Alibaba com os padrões de raciocínio do R1-0528 completo, essa versão menor pode rodar em uma única GPU de consumo, superando o Gemini 2.5 Flash do Google em certos benchmarks matemáticos e quase igualando o modelo Phi 4 reasoning plus da Microsoft.
Assim como seu antecessor, o R1-0528 está disponível sob a licença permissiva MIT, permitindo uso comercial e customização. Grandes provedores de nuvem, incluindo Amazon Web Services e Microsoft Azure, já oferecem os modelos da DeepSeek a seus clientes, isolando-os de servidores chineses para garantir a privacidade dos dados.
Esse lançamento consolida ainda mais a DeepSeek e a Meta como líderes no espaço de IA open source, oferecendo alternativas poderosas aos modelos proprietários da OpenAI, Google, Microsoft e Anthropic, com uma fração do custo computacional.