menu
close

Google розширює контроль витрат на ШІ для Gemini 2.5 Pro

Google розширила функцію «бюджетів мислення» з Gemini 2.5 Flash на Gemini 2.5 Pro, надаючи розробникам точний контроль над витратами на роботу ШІ. Ця можливість дозволяє користувачам обмежувати кількість токенів, які модель використовує для міркування, або повністю вимикати цю функцію, забезпечуючи баланс між продуктивністю та економічною ефективністю. Функція вирішує важливу проблему для бізнесу, який впроваджує передові ШІ у великому масштабі, адже міркування зазвичай суттєво підвищують операційні витрати.
Google розширює контроль витрат на ШІ для Gemini 2.5 Pro

Google оголосила про розширення своєї інноваційної функції «бюджетів мислення» на Gemini 2.5 Pro — найпотужнішу модель компанії для міркувань, після успішного впровадження цієї можливості в Gemini 2.5 Flash на початку цього року.

Функція бюджетів мислення є значним кроком уперед у сфері управління витратами на ШІ, дозволяючи розробникам точно контролювати, скільки обчислювальних ресурсів виділяється на розв’язання складних завдань. Завдяки цій можливості користувачі можуть вказати максимальну кількість токенів, які модель використовує для внутрішнього міркування перед формуванням відповіді, або навіть повністю вимкнути цю функцію для простих завдань.

«Ми запустили 2.5 Flash із бюджетами мислення, щоб дати розробникам більше контролю над витратами через балансування затримки та якості. І тепер ми розширюємо цю можливість на 2.5 Pro», — йдеться в оголошенні Google. Компанія підтвердила, що Gemini 2.5 Pro з підтримкою бюджетів буде загальнодоступною для стабільного виробничого використання протягом найближчих тижнів.

Цей розвиток вирішує фундаментальну проблему сучасного ринку ШІ, де складніші міркування зазвичай збільшують як затримку, так і вартість. Наприклад, у Gemini 2.5 Flash активація міркувань підвищує вартість обробки майже в шість разів — з $0,60 до $3,50 за мільйон токенів. Завдяки впровадженню бюджетів мислення бізнес може оптимізувати використання ШІ відповідно до конкретних сценаріїв, вмикаючи міркування лише за необхідності.

Функція особливо корисна для корпоративних клієнтів, які мають ретельно контролювати витрати на впровадження ШІ, не втрачаючи при цьому доступу до передових можливостей. Для простих запитів, таких як переклад тексту чи базовий пошук інформації, міркування можна вимкнути для максимальної економії. Для складних завдань, що вимагають багатоступеневого аналізу — наприклад, розв’язання математичних задач чи глибокої аналітики — функцію мислення можна активувати та налаштувати.

У міру того, як ШІ дедалі глибше інтегрується у бізнес-процеси, підхід Google із налаштовуваним міркуванням відображає зрілий ринок, де оптимізація витрат і налаштування продуктивності стають не менш важливими, ніж самі можливості — це сигналізує про новий етап комерціалізації генеративних ШІ-технологій.

Source:

Latest News