menu
close

OpenAI тестирует TPU от Google для борьбы с растущими затратами на инференс ИИ

OpenAI начала тестирование тензорных процессоров Google (TPU) в поисках альтернатив для управления растущими расходами на инференс искусственного интеллекта, который теперь занимает более 50% вычислительного бюджета компании. Хотя это не означает немедренного масштабного внедрения, стратегический шаг знаменует собой первый значимый опыт использования OpenAI аппаратного обеспечения, отличного от NVIDIA, и указывает на отход от эксклюзивной зависимости от инфраструктуры Microsoft. Этот шаг может изменить ландшафт рынка аппаратного обеспечения для ИИ, бросив вызов доминированию NVIDIA и создав новые конкурентные условия среди ведущих технологических компаний.
OpenAI тестирует TPU от Google для борьбы с растущими затратами на инференс ИИ

OpenAI, один из крупнейших мировых покупателей графических процессоров (GPU) NVIDIA, начала тестирование тензорных процессоров Google (TPU) для работы своих ИИ-систем, включая ChatGPT. Этот шаг обусловлен ростом вычислительных расходов компании и поиском более экономичных решений для масштабирования своих ИИ-операций.

По оценкам отраслевых аналитиков, инференс — процесс, при котором ИИ-модели используют обученные знания для предсказаний или принятия решений — теперь потребляет более 50% вычислительного бюджета OpenAI. TPU, особенно более ранних поколений, обеспечивают значительно более низкую стоимость инференса по сравнению с GPU NVIDIA, что делает их привлекательной альтернативой, несмотря на потенциально меньшую производительность по сравнению с новейшими чипами NVIDIA.

«Хотя старые TPU уступают по пиковым характеристикам новым чипам Nvidia, их специализированная архитектура минимизирует потери энергии и простаивание ресурсов, что делает их более экономичными при масштабном использовании», — объясняет Чарли Дай, вице-президент и ведущий аналитик Forrester. По оценкам экспертов, Google может получать вычислительные мощности для ИИ примерно за 20% стоимости, которую платят покупатели топовых GPU NVIDIA, что подразумевает преимущество по эффективности затрат в 4–6 раз.

Однако в OpenAI уточнили, что не планируют немедленного масштабного внедрения TPU. Представитель компании сообщил Reuters, что OpenAI находится «на ранней стадии тестирования некоторых TPU Google», но в настоящее время «не планирует их масштабного внедрения». Такая осторожность объясняется значительными техническими сложностями перехода инфраструктуры, поскольку программное обеспечение OpenAI в первую очередь оптимизировано под GPU.

Помимо экономических соображений, этот шаг отражает стратегическую диверсификацию вычислительных ресурсов OpenAI за пределы Microsoft, которая до января 2025 года оставалась эксклюзивным поставщиком дата-центров для компании. OpenAI уже сотрудничает с Oracle и CoreWeave в рамках инфраструктурной программы Stargate, а также разрабатывает собственный специализированный процессор для ИИ, который, как ожидается, достигнет стадии tape-out позже в этом году.

Последствия для рынка аппаратного обеспечения для ИИ могут быть значительными. Если опыт OpenAI с TPU окажется успешным, это подтвердит жизнеспособность аппаратных решений Google как альтернативы почти монопольному положению NVIDIA в сфере высокопроизводительных ИИ-вычислений. Это может вынудить NVIDIA к инновациям или пересмотру ценовой политики, а также создать новые конкурентные условия между облачными провайдерами — такими как Google, Microsoft и Amazon — которые борются за лидерство в инфраструктуре для искусственного интеллекта.

Source: Computerworld

Latest News