OpenAI, един от най-големите световни клиенти на графичните процесори (GPU) на NVIDIA, започна да тества Tensor Processing Units (TPU) на Google за захранване на своите AI системи, включително ChatGPT. Това се случва на фона на нарастващи разходи за изчисления и търсене на по-ефективни решения за разрастващите се AI операции на компанията.
Според анализатори от индустрията, инференцията — процесът, при който AI моделите използват наученото, за да правят прогнози или вземат решения — вече поглъща над 50% от изчислителния бюджет на OpenAI. TPU процесорите, особено по-старите поколения, предлагат значително по-ниска цена на инференция в сравнение с GPU на NVIDIA, което ги прави привлекателна алтернатива, въпреки че може да не достигат върховата производителност на най-новите чипове на NVIDIA.
„Въпреки че по-старите TPU не достигат върховата производителност на новите чипове на Nvidia, тяхната специализирана архитектура минимизира енергийните загуби и неизползваните ресурси, което ги прави по-икономични в голям мащаб“, обяснява Чарли Дай, вицепрезидент и главен анализатор във Forrester. Анализите сочат, че Google може да осигури AI изчислителна мощност на приблизително 20% от разходите, които плащат клиентите за висок клас GPU на NVIDIA, което означава 4-6 пъти по-голяма ефективност по отношение на разходите.
Въпреки това OpenAI уточнява, че няма незабавни планове за мащабно внедряване на TPU. Говорител на компанията заяви пред Reuters, че са в „начален етап на тестове с някои TPU на Google“, но към момента „нямат планове да ги внедрят в голям мащаб“. Този предпазлив подход отразява значителните технически предизвикателства при преминаването към нова инфраструктура, тъй като софтуерният стек на OpenAI е оптимизиран основно за GPU.
Освен финансовите съображения, този ход представлява стратегическа диверсификация на изчислителните източници на OpenAI отвъд Microsoft, която беше изключителен доставчик на центрове за данни до януари 2025 г. Компанията вече си партнира с Oracle и CoreWeave по инфраструктурната програма Stargate и разработва собствен AI процесор, който се очаква да достигне етапа на tape-out по-късно тази година.
Последиците за пазара на AI хардуер могат да бъдат значителни. Ако OpenAI успешно внедри TPU, това би могло да утвърди хардуера на Google като реална алтернатива на почти монополното положение на NVIDIA в областта на високопроизводителните AI изчисления. Това може да окаже натиск върху NVIDIA да иновира или да коригира цените си, като същевременно създаде нови конкурентни динамики между облачните доставчици като Google, Microsoft и Amazon в борбата им за доминация в AI инфраструктурата.