menu
close

OpenAI тестує TPU від Google для боротьби зі зростанням витрат на AI-інференс

OpenAI розпочала тестування тензорних процесорів Google (TPU), досліджуючи альтернативи для стримування зростаючих витрат на інференс штучного інтелекту, які вже перевищують 50% її обчислювального бюджету. Хоча це не означає негайного масштабного впровадження, цей стратегічний крок є першим суттєвим використанням OpenAI апаратного забезпечення, окрім NVIDIA, і свідчить про відхід від ексклюзивної залежності від інфраструктури Microsoft. Таке дослідження може змінити ландшафт AI-обладнання, кинувши виклик домінуванню NVIDIA та створивши нову конкуренцію серед провідних технологічних гравців.
OpenAI тестує TPU від Google для боротьби зі зростанням витрат на AI-інференс

OpenAI, один із найбільших у світі споживачів графічних процесорів NVIDIA, почала тестувати тензорні процесори Google (TPU) для роботи своїх AI-систем, зокрема ChatGPT. Цей крок пов’язаний зі зростанням витрат на обчислення та пошуком більш економічних рішень для масштабування AI-операцій компанії.

За даними галузевих аналітиків, інференс — процес, у якому моделі ШІ використовують набуті знання для прогнозування чи прийняття рішень — нині споживає понад 50% обчислювального бюджету OpenAI. TPU, особливо попередніх поколінь, забезпечують значно нижчу вартість інференсу порівняно з GPU NVIDIA, що робить їх привабливою альтернативою, навіть попри потенційну відсутність пікової продуктивності новітніх чипів NVIDIA.

«Хоча старіші TPU поступаються піковою продуктивністю новим чипам Nvidia, їхня спеціалізована архітектура мінімізує енергетичні втрати та простої, що робить їх ефективнішими за витратами у масштабі», — пояснює Чарлі Дай, віцепрезидент і головний аналітик Forrester. За оцінками експертів, Google може отримувати обчислювальні потужності для AI приблизно за 20% вартості, яку платять покупці топових GPU NVIDIA, що дає перевагу у 4–6 разів за ефективністю витрат.

Втім, OpenAI уточнила, що не має негайних планів щодо масштабного впровадження TPU. Представник компанії повідомив Reuters, що наразі йдеться лише про «початкове тестування деяких TPU від Google» і що «наразі немає планів щодо їх масштабного розгортання». Така обережність пояснюється значними технічними викликами при переході інфраструктури, адже програмне забезпечення OpenAI оптимізоване насамперед під GPU.

Окрім економічних міркувань, цей крок означає стратегічну диверсифікацію джерел обчислювальних ресурсів OpenAI поза межами Microsoft, яка залишалася ексклюзивним постачальником дата-центрів компанії до січня 2025 року. OpenAI вже співпрацює з Oracle і CoreWeave у межах програми інфраструктури Stargate, а також розробляє власний спеціалізований AI-процесор, який має досягти етапу tape-out вже цього року.

Наслідки для ринку AI-обладнання можуть бути значними. Якщо експеримент OpenAI з TPU буде успішним, це підтвердить життєздатність апаратного забезпечення Google як альтернативи майже монопольному становищу NVIDIA у сфері високопродуктивних AI-обчислень. Це може змусити NVIDIA інноваційно реагувати або змінювати ціноутворення, а також створити нову конкуренцію між хмарними провайдерами — Google, Microsoft та Amazon — у боротьбі за лідерство в AI-інфраструктурі.

Source: Computerworld

Latest News