A DeepSeek, startup chinesa de inteligência artificial que abalou os mercados tecnológicos em janeiro com o inovador modelo R1, lançou discretamente uma atualização significativa ao seu principal sistema de IA.
A nova versão, denominada DeepSeek-R1-0528, foi disponibilizada a 28 de maio através de um breve anúncio no grupo WeChat da empresa. Apesar de a DeepSeek a descrever como uma "atualização experimental menor", os primeiros testes revelam melhorias substanciais em várias áreas.
De acordo com o ranking LiveCodeBench, o modelo atualizado ocupa agora o quarto lugar em capacidades de programação, com uma pontuação Pass@1 de 73,1, ficando apenas atrás dos modelos O3 e O4-Mini da OpenAI. Este feito representa um avanço significativo para um modelo open-source, especialmente tendo em conta os recursos bastante inferiores face aos concorrentes ocidentais.
As especificações técnicas mostram que o R1-0528 mantém a arquitetura Mixture-of-Experts (MoE) do seu antecessor, com cerca de 685 mil milhões de parâmetros no total, embora apenas cerca de 37 mil milhões estejam ativos durante a inferência. O modelo suporta agora uma janela de contexto expandida até 128 mil tokens, permitindo processar documentos e bases de código de dimensão muito superior.
O feedback dos utilizadores destaca melhorias na profundidade do raciocínio, qualidade da escrita e capacidade de resolução de problemas. Os programadores relatam que o modelo consegue agora realizar sessões de raciocínio prolongadas, de 30 a 60 minutos, para tarefas complexas, à semelhança dos modelos da Google. A atualização também corrige problemas anteriores na geração de texto, produzindo conteúdos mais naturais e melhor formatados.
A contínua inovação da DeepSeek desafia a ideia de que a escalabilidade da IA exige enormes recursos computacionais e investimentos avultados. O sucesso da empresa com modelos open-source e económicos já obrigou os gigantes tecnológicos a reagir, com a OpenAI a baixar preços e a Google a lançar níveis de acesso com desconto. Entretanto, concorrentes chineses como a Alibaba e a Tencent lançaram os seus próprios modelos, alegando superar as capacidades da DeepSeek.
A atualização R1-0528 está disponível no Hugging Face sob licença MIT, permitindo utilização comercial e modificações. Observadores do setor antecipam que a DeepSeek venha a lançar o seu modelo R2, mais abrangente, nos próximos meses, podendo provocar novas disrupções no panorama da IA.