menu
close

Google расширяет контроль затрат на ИИ для Gemini 2.5 Pro

Google распространила функцию «бюджетов на размышления» с Gemini 2.5 Flash на Gemini 2.5 Pro, предоставив разработчикам точный контроль над затратами на рассуждения ИИ. Эта возможность позволяет ограничивать количество токенов, используемых моделью для рассуждений, или полностью отключать размышления, обеспечивая баланс между производительностью и экономической эффективностью. Функция решает важную задачу для компаний, внедряющих продвинутый ИИ в масштабах бизнеса, поскольку рассуждения обычно требуют значительно больших операционных расходов.
Google расширяет контроль затрат на ИИ для Gemini 2.5 Pro

Google объявила о расширении инновационной функции «бюджеты на размышления» на Gemini 2.5 Pro — самую продвинутую модель рассуждений компании, после успешного внедрения этой функции в Gemini 2.5 Flash ранее в этом году.

Функция «бюджеты на размышления» представляет собой значительный шаг вперёд в управлении затратами на ИИ, позволяя разработчикам точно контролировать, сколько вычислительных ресурсов выделяется на решение сложных задач. Благодаря этой возможности пользователи могут задать максимальное количество токенов, которые модель использует для внутренних рассуждений перед генерацией ответа, либо полностью отключить функцию размышлений для более простых задач.

«Мы запустили 2.5 Flash с бюджетами на размышления, чтобы дать разработчикам больше контроля над затратами, балансируя задержку и качество. Теперь мы расширяем эту возможность на 2.5 Pro», — говорится в заявлении Google. Компания подтвердила, что Gemini 2.5 Pro с поддержкой бюджетов будет доступна для стабильного промышленного использования в ближайшие недели.

Это нововведение решает фундаментальное противоречие на современном рынке ИИ, где более сложные рассуждения обычно увеличивают как задержку, так и стоимость. Например, в Gemini 2.5 Flash включение рассуждений увеличивает стоимость вывода почти в шесть раз — с $0,60 до $3,50 за миллион токенов. Благодаря внедрению бюджетов на размышления компании могут оптимизировать использование ИИ под конкретные задачи, включая рассуждения только при необходимости.

Функция особенно ценна для корпоративных клиентов, которым важно тщательно управлять расходами на внедрение ИИ, сохраняя доступ к продвинутым возможностям. Для простых запросов, таких как перевод текста или базовый поиск информации, размышления можно отключить для максимальной экономии. Для сложных задач, требующих многошаговых рассуждений — например, решения математических задач или тонкого анализа — функцию размышлений можно включить и настроить.

По мере того как ИИ всё глубже интегрируется в бизнес-процессы, подход Google с настраиваемыми возможностями рассуждения отражает зрелость рынка, где оптимизация затрат и настройка производительности становятся столь же важны, как и сами возможности — что свидетельствует о новом этапе коммерциализации генеративных ИИ-технологий.

Source:

Latest News