menu
close

Google Estende Controles de Custos de IA ao Gemini 2.5 Pro

O Google expandiu o recurso de 'orçamento de raciocínio' do Gemini 2.5 Flash para o Gemini 2.5 Pro, permitindo que desenvolvedores controlem com precisão os custos de raciocínio da IA. Essa funcionalidade possibilita limitar o número de tokens usados pelo modelo para raciocínio ou até mesmo desativar totalmente o raciocínio, equilibrando desempenho e eficiência econômica. O recurso atende a um desafio crítico para empresas que implementam IA avançada em larga escala, já que capacidades de raciocínio normalmente acarretam custos operacionais significativamente maiores.
Google Estende Controles de Custos de IA ao Gemini 2.5 Pro

O Google anunciou a ampliação do inovador recurso de 'orçamento de raciocínio' para o Gemini 2.5 Pro, seu modelo de IA mais avançado em raciocínio, após a implementação bem-sucedida no Gemini 2.5 Flash no início deste ano.

O orçamento de raciocínio representa um avanço significativo na gestão de custos de IA, permitindo que desenvolvedores controlem com precisão quanta capacidade computacional é destinada ao raciocínio de problemas complexos. Com essa funcionalidade, os usuários podem definir o número máximo de tokens que o modelo utilizará para raciocínio interno antes de gerar uma resposta, ou até mesmo desativar completamente o raciocínio para tarefas mais simples.

"Lançamos o 2.5 Flash com orçamentos de raciocínio para dar aos desenvolvedores mais controle sobre os custos, equilibrando latência e qualidade. E estamos estendendo essa capacidade ao 2.5 Pro", afirmou o Google em seu comunicado. A empresa confirmou que o Gemini 2.5 Pro com orçamentos estará disponível para uso estável em produção nas próximas semanas.

Esse desenvolvimento aborda uma tensão fundamental no mercado atual de IA, onde raciocínios mais sofisticados geralmente aumentam tanto a latência quanto o custo. Por exemplo, no Gemini 2.5 Flash, ativar o raciocínio eleva o custo de saída em quase seis vezes — de US$ 0,60 para US$ 3,50 por milhão de tokens. Ao implementar orçamentos de raciocínio, as empresas podem otimizar o uso da IA conforme o caso de uso, ativando o raciocínio apenas quando necessário.

O recurso é especialmente valioso para clientes corporativos que precisam gerenciar cuidadosamente os custos de implantação de IA sem abrir mão de capacidades avançadas. Para consultas simples, como tradução de idiomas ou busca básica de informações, o raciocínio pode ser desativado para máxima eficiência de custos. Para tarefas complexas que exigem raciocínio em múltiplas etapas, como resolução de problemas matemáticos ou análises detalhadas, a função de raciocínio pode ser ativada e ajustada conforme necessário.

À medida que a IA se integra cada vez mais aos fluxos de trabalho empresariais, a abordagem do Google com raciocínio personalizável reflete um mercado em amadurecimento, onde a otimização de custos e o ajuste de desempenho tornam-se tão importantes quanto as capacidades brutas — sinalizando uma nova fase na comercialização das tecnologias de IA generativa.

Source:

Latest News