A DeepSeek, startup chinesa de inteligência artificial que abalou o mercado de tecnologia em janeiro com seu inovador modelo R1, lançou discretamente uma atualização significativa para seu principal sistema de IA.
A nova versão, chamada DeepSeek-R1-0528, foi disponibilizada em 28 de maio por meio de um breve anúncio no grupo da empresa no WeChat. Apesar de a DeepSeek classificá-la como uma "atualização experimental menor", testes iniciais revelam avanços substanciais em múltiplas áreas.
Segundo o ranking do LiveCodeBench, o modelo atualizado agora ocupa a quarta posição em capacidades de programação, com uma pontuação Pass@1 de 73,1, ficando logo atrás dos modelos O3 e O4-Mini da OpenAI. Isso representa um grande salto para um modelo open-source, especialmente considerando que foi desenvolvido com recursos significativamente menores do que seus concorrentes ocidentais.
As especificações técnicas mostram que o R1-0528 mantém a arquitetura Mixture-of-Experts (MoE) de seu antecessor, com aproximadamente 685 bilhões de parâmetros no total, embora apenas cerca de 37 bilhões sejam ativados durante a inferência. O modelo agora suporta uma janela de contexto expandida de até 128 mil tokens, permitindo processar documentos e bases de código muito maiores.
O feedback dos usuários destaca melhorias na profundidade de raciocínio, qualidade de escrita e capacidade de resolução de problemas. Desenvolvedores relatam que o modelo agora consegue realizar sessões de raciocínio estendidas de 30 a 60 minutos para tarefas complexas, semelhante aos modelos do Google. A atualização também corrige peculiaridades anteriores na geração de texto, produzindo conteúdos mais naturais e melhor formatados.
A contínua inovação da DeepSeek desafia a ideia de que escalar IA exige enorme poder computacional e grandes investimentos. O sucesso da empresa com modelos open-source e de baixo custo já provocou reações dos gigantes da tecnologia, levando a OpenAI a reduzir preços e o Google a lançar níveis de acesso com desconto. Enquanto isso, concorrentes chineses como Alibaba e Tencent lançaram seus próprios modelos, alegando superar as capacidades da DeepSeek.
A atualização R1-0528 está disponível no Hugging Face sob licença MIT, permitindo uso comercial e modificações. Observadores do setor esperam que a DeepSeek lance em breve seu modelo R2 mais abrangente, com potencial para causar ainda mais impacto no cenário de IA.