menu
close

Modelos de IA Aprendem Agora a Dedicar Mais Tempo a Problemas Complexos

Foi desenvolvido um modelo de IA inovador que aprende a alocar mais recursos computacionais a problemas difíceis, imitando a forma como os humanos dedicam mais tempo a tarefas desafiantes. Esta capacidade de raciocínio adaptativo permite soluções mais robustas e melhor generalização para cenários novos e desconhecidos. A inovação representa um avanço significativo na resolução de problemas por IA, ultrapassando o reconhecimento de padrões e aproximando-se de processos de raciocínio mais semelhantes aos humanos.
Modelos de IA Aprendem Agora a Dedicar Mais Tempo a Problemas Complexos

Investigadores desenvolveram uma nova geração de modelos de IA capazes de ajustar dinamicamente o esforço computacional em função da complexidade do problema, representando uma mudança significativa na forma como a inteligência artificial aborda tarefas desafiantes.

A tecnologia, exemplificada por modelos como o DeepSeek-R1 e a série o da OpenAI, utiliza aquilo a que os desenvolvedores chamam uma "abordagem centrada no raciocínio", que privilegia uma análise aprofundada em detrimento da simples correspondência rápida de padrões. O DeepSeek-R1 foi concebido com esta metodologia centrada no raciocínio, tornando-o particularmente adequado para enfrentar tarefas complexas em áreas como ciência, programação e matemática, através de inferência lógica avançada e resolução de problemas. Este foco em "pensar antes de responder" torna-o especialmente valioso para aplicações técnicas.

Ao contrário dos sistemas de IA convencionais, estes novos modelos de raciocínio são treinados para "pensar durante mais tempo" antes de responder. O o3 da OpenAI, por exemplo, consegue decompor questões difíceis em passos lógicos, realizar cálculos intermédios ou chamadas a ferramentas, e só depois apresentar respostas fundamentadas. Sendo modelos de raciocínio, conseguem efetivamente verificar os próprios factos, o que ajuda a evitar armadilhas que normalmente comprometem os modelos tradicionais. Embora demorem segundos a minutos adicionais a chegar a soluções, em comparação com modelos não baseados em raciocínio, tendem a ser mais fiáveis em domínios como física, ciência e matemática.

A OpenAI observou que o reforço de aprendizagem em larga escala apresenta a mesma tendência de "mais computação = melhor desempenho" já vista no treino de modelos anteriores. Ao refazer o percurso de escalabilidade—desta vez em aprendizagem por reforço—conseguiram aumentar em mais uma ordem de grandeza tanto o esforço computacional no treino como o raciocínio durante a inferência, com ganhos de desempenho claros que validam que o desempenho dos modelos continua a melhorar quanto mais tempo lhes for permitido pensar.

Estes modelos geram ativamente múltiplos caminhos de solução durante a inferência, avaliando cada um deles com a ajuda de modelos avaliadores integrados para determinar a opção mais promissora. Ao treinar o avaliador com dados rotulados por especialistas, os desenvolvedores garantem que os modelos desenvolvem uma forte capacidade de raciocínio em problemas complexos e de múltiplos passos. Esta funcionalidade permite ao modelo atuar como juiz do seu próprio raciocínio, aproximando os grandes modelos de linguagem da capacidade de "pensar" em vez de apenas responder.

A abordagem da DeepSeek combina raciocínio em cadeia de pensamento com aprendizagem por reforço, onde um agente autónomo aprende a executar uma tarefa por tentativa e erro, sem instruções humanas. Isto coloca em causa a suposição de que os modelos melhoram a sua capacidade de raciocínio apenas ao serem treinados com exemplos rotulados de comportamento correto. Como referiu um dos investigadores: "Podemos simplesmente recompensar o modelo pela correção e deixá-lo descobrir por si próprio a melhor forma de pensar?"

As implicações para aplicações no mundo real são profundas. Estes modelos podem transformar a forma como a IA lida com problemas complexos em áreas que vão desde a investigação científica e engenharia até à estratégia empresarial e à resolução criativa de problemas. Ao alocar recursos computacionais proporcionalmente à dificuldade da tarefa—de modo semelhante à forma como os humanos naturalmente dedicam mais tempo a problemas mais difíceis—estes sistemas prometem um desempenho mais fiável nas tarefas intelectuais mais desafiantes que a humanidade enfrenta.

Source:

Latest News