menu
close

DeepSeek Atualiza Modelo de IA R1 e Lança Desafio aos Gigantes Tecnológicos Ocidentais

A startup chinesa de IA DeepSeek lançou uma atualização ao seu modelo de raciocínio R1, que impulsionou a empresa para a ribalta global no início deste ano. A atualização R1-0528, embora descrita como 'menor' pela empresa, apresenta melhorias significativas nas capacidades de programação, profundidade de raciocínio e tarefas de escrita. O modelo atualizado mantém a abordagem económica da DeepSeek no desenvolvimento de IA, rivalizando com o desempenho de modelos da OpenAI e da Google.
DeepSeek Atualiza Modelo de IA R1 e Lança Desafio aos Gigantes Tecnológicos Ocidentais

A DeepSeek, startup chinesa de inteligência artificial que abalou os mercados tecnológicos em janeiro com o inovador modelo R1, lançou discretamente uma atualização significativa ao seu principal sistema de IA.

A nova versão, denominada DeepSeek-R1-0528, foi disponibilizada a 28 de maio através de um breve anúncio no grupo WeChat da empresa. Apesar de a DeepSeek a descrever como uma "atualização experimental menor", os primeiros testes revelam melhorias substanciais em várias áreas.

De acordo com o ranking LiveCodeBench, o modelo atualizado ocupa agora o quarto lugar em capacidades de programação, com uma pontuação Pass@1 de 73,1, ficando apenas atrás dos modelos O3 e O4-Mini da OpenAI. Este feito representa um avanço significativo para um modelo open-source, especialmente tendo em conta os recursos bastante inferiores face aos concorrentes ocidentais.

As especificações técnicas mostram que o R1-0528 mantém a arquitetura Mixture-of-Experts (MoE) do seu antecessor, com cerca de 685 mil milhões de parâmetros no total, embora apenas cerca de 37 mil milhões estejam ativos durante a inferência. O modelo suporta agora uma janela de contexto expandida até 128 mil tokens, permitindo processar documentos e bases de código de dimensão muito superior.

O feedback dos utilizadores destaca melhorias na profundidade do raciocínio, qualidade da escrita e capacidade de resolução de problemas. Os programadores relatam que o modelo consegue agora realizar sessões de raciocínio prolongadas, de 30 a 60 minutos, para tarefas complexas, à semelhança dos modelos da Google. A atualização também corrige problemas anteriores na geração de texto, produzindo conteúdos mais naturais e melhor formatados.

A contínua inovação da DeepSeek desafia a ideia de que a escalabilidade da IA exige enormes recursos computacionais e investimentos avultados. O sucesso da empresa com modelos open-source e económicos já obrigou os gigantes tecnológicos a reagir, com a OpenAI a baixar preços e a Google a lançar níveis de acesso com desconto. Entretanto, concorrentes chineses como a Alibaba e a Tencent lançaram os seus próprios modelos, alegando superar as capacidades da DeepSeek.

A atualização R1-0528 está disponível no Hugging Face sob licença MIT, permitindo utilização comercial e modificações. Observadores do setor antecipam que a DeepSeek venha a lançar o seu modelo R2, mais abrangente, nos próximos meses, podendo provocar novas disrupções no panorama da IA.

Source:

Latest News