menu
close

Google Alarga Controlo de Custos de IA ao Gemini 2.5 Pro

A Google expandiu a funcionalidade de 'orçamentos de raciocínio' do Gemini 2.5 Flash para o Gemini 2.5 Pro, permitindo aos programadores um controlo preciso sobre os custos de raciocínio da IA. Esta capacidade possibilita limitar o número de tokens usados pelo modelo para raciocínio ou desativar totalmente essa função, equilibrando desempenho e eficiência económica. A funcionalidade responde a um desafio crítico para empresas que implementam IA avançada em larga escala, já que as capacidades de raciocínio implicam custos operacionais significativamente superiores.
Google Alarga Controlo de Custos de IA ao Gemini 2.5 Pro

A Google anunciou a extensão da sua inovadora funcionalidade de 'orçamentos de raciocínio' ao Gemini 2.5 Pro, o modelo de IA de raciocínio mais avançado da empresa, após a sua implementação bem-sucedida no Gemini 2.5 Flash no início deste ano.

A funcionalidade de orçamentos de raciocínio representa um avanço significativo na gestão de custos de IA, permitindo aos programadores controlar com precisão a quantidade de poder computacional alocada ao raciocínio em problemas complexos. Com esta capacidade, os utilizadores podem especificar o número máximo de tokens que o modelo utiliza para raciocínio interno antes de gerar uma resposta, ou até mesmo desligar completamente as capacidades de raciocínio para tarefas mais simples.

"Lançámos o 2.5 Flash com orçamentos de raciocínio para dar aos programadores mais controlo sobre os custos, equilibrando latência e qualidade. E estamos a expandir esta capacidade para o 2.5 Pro", afirmou a Google no seu anúncio. A empresa confirmou que o Gemini 2.5 Pro com orçamentos estará disponível de forma geral para utilização em produção estável nas próximas semanas.

Este desenvolvimento responde a uma tensão fundamental no mercado atual de IA, onde raciocínio mais sofisticado normalmente aumenta tanto a latência como o custo. Por exemplo, no Gemini 2.5 Flash, ativar o raciocínio faz com que o custo por output aumente quase seis vezes — de $0,60 para $3,50 por milhão de tokens. Ao implementar orçamentos de raciocínio, as empresas podem otimizar as suas implementações de IA consoante os casos de uso, ativando o raciocínio apenas quando necessário.

A funcionalidade é especialmente valiosa para clientes empresariais que precisam de gerir cuidadosamente os custos de implementação de IA, sem abdicar de capacidades avançadas. Para consultas simples, como tradução de idiomas ou pesquisa básica de informação, o raciocínio pode ser desativado para máxima eficiência de custos. Para tarefas complexas que exigem raciocínio em múltiplos passos, como resolução de problemas matemáticos ou análise detalhada, a função de raciocínio pode ser ativada e ajustada.

À medida que a IA se integra cada vez mais nos fluxos de trabalho empresariais, a abordagem da Google com raciocínio personalizável reflete um mercado em maturação, onde a otimização de custos e o ajuste de desempenho se tornam tão importantes quanto as capacidades brutas — sinalizando uma nova fase na comercialização das tecnologias de IA generativa.

Source:

Latest News