menu
close

Google amplía los controles de costes de IA a Gemini 2.5 Pro

Google ha ampliado su función de 'presupuestos de razonamiento' de Gemini 2.5 Flash a Gemini 2.5 Pro, ofreciendo a los desarrolladores un control preciso sobre los costes de razonamiento de la IA. Esta capacidad permite limitar el número de tokens que un modelo utiliza para razonar o desactivar el razonamiento por completo, equilibrando el rendimiento con la eficiencia económica. La función responde a un reto clave para las empresas que despliegan IA avanzada a gran escala, ya que las capacidades de razonamiento suelen conllevar costes operativos significativamente más altos.
Google amplía los controles de costes de IA a Gemini 2.5 Pro

Google ha anunciado la ampliación de su innovadora función de 'presupuestos de razonamiento' a Gemini 2.5 Pro, el modelo de razonamiento de IA más avanzado de la compañía, tras su exitosa implementación en Gemini 2.5 Flash a principios de este año.

La función de presupuestos de razonamiento supone un avance significativo en la gestión de costes de la IA, ya que permite a los desarrolladores controlar con precisión cuánta potencia computacional se asigna al razonamiento de problemas complejos. Con esta capacidad, los usuarios pueden especificar el número máximo de tokens que un modelo utiliza para el razonamiento interno antes de generar una respuesta, o incluso desactivar por completo las capacidades de razonamiento para tareas más sencillas.

"Lanzamos 2.5 Flash con presupuestos de razonamiento para dar a los desarrolladores más control sobre los costes, equilibrando latencia y calidad. Y ahora extendemos esta capacidad a 2.5 Pro", afirmó Google en su comunicado. La compañía ha confirmado que Gemini 2.5 Pro con presupuestos estará disponible de forma general para su uso en producción estable en las próximas semanas.

Este desarrollo aborda una tensión fundamental en el mercado actual de la IA, donde un razonamiento más sofisticado suele aumentar tanto la latencia como el coste. Por ejemplo, con Gemini 2.5 Flash, activar el razonamiento incrementa casi seis veces el coste de salida: de 0,60 $ a 3,50 $ por millón de tokens. Al implementar presupuestos de razonamiento, las empresas pueden optimizar sus despliegues de IA en función de casos de uso concretos, habilitando el razonamiento solo cuando sea necesario.

La función resulta especialmente valiosa para clientes empresariales que necesitan gestionar cuidadosamente los costes de despliegue de IA sin renunciar a capacidades avanzadas. Para consultas sencillas como traducción de idiomas o recuperación básica de información, el razonamiento puede desactivarse para maximizar la eficiencia de costes. Para tareas complejas que requieren razonamiento en varios pasos, como la resolución de problemas matemáticos o análisis matizados, la función de razonamiento puede activarse y ajustarse.

A medida que la IA se integra cada vez más en los flujos de trabajo empresariales, el enfoque de Google con el razonamiento personalizable refleja un mercado en maduración, donde la optimización de costes y el ajuste del rendimiento son tan importantes como las capacidades brutas, señalando una nueva fase en la comercialización de tecnologías de IA generativa.

Source:

Latest News