OpenAI, один из крупнейших мировых покупателей графических процессоров (GPU) NVIDIA, начала тестирование тензорных процессоров Google (TPU) для работы своих ИИ-систем, включая ChatGPT. Этот шаг обусловлен ростом вычислительных расходов компании и поиском более экономичных решений для масштабирования своих ИИ-операций.
По оценкам отраслевых аналитиков, инференс — процесс, при котором ИИ-модели используют обученные знания для предсказаний или принятия решений — теперь потребляет более 50% вычислительного бюджета OpenAI. TPU, особенно более ранних поколений, обеспечивают значительно более низкую стоимость инференса по сравнению с GPU NVIDIA, что делает их привлекательной альтернативой, несмотря на потенциально меньшую производительность по сравнению с новейшими чипами NVIDIA.
«Хотя старые TPU уступают по пиковым характеристикам новым чипам Nvidia, их специализированная архитектура минимизирует потери энергии и простаивание ресурсов, что делает их более экономичными при масштабном использовании», — объясняет Чарли Дай, вице-президент и ведущий аналитик Forrester. По оценкам экспертов, Google может получать вычислительные мощности для ИИ примерно за 20% стоимости, которую платят покупатели топовых GPU NVIDIA, что подразумевает преимущество по эффективности затрат в 4–6 раз.
Однако в OpenAI уточнили, что не планируют немедленного масштабного внедрения TPU. Представитель компании сообщил Reuters, что OpenAI находится «на ранней стадии тестирования некоторых TPU Google», но в настоящее время «не планирует их масштабного внедрения». Такая осторожность объясняется значительными техническими сложностями перехода инфраструктуры, поскольку программное обеспечение OpenAI в первую очередь оптимизировано под GPU.
Помимо экономических соображений, этот шаг отражает стратегическую диверсификацию вычислительных ресурсов OpenAI за пределы Microsoft, которая до января 2025 года оставалась эксклюзивным поставщиком дата-центров для компании. OpenAI уже сотрудничает с Oracle и CoreWeave в рамках инфраструктурной программы Stargate, а также разрабатывает собственный специализированный процессор для ИИ, который, как ожидается, достигнет стадии tape-out позже в этом году.
Последствия для рынка аппаратного обеспечения для ИИ могут быть значительными. Если опыт OpenAI с TPU окажется успешным, это подтвердит жизнеспособность аппаратных решений Google как альтернативы почти монопольному положению NVIDIA в сфере высокопроизводительных ИИ-вычислений. Это может вынудить NVIDIA к инновациям или пересмотру ценовой политики, а также создать новые конкурентные условия между облачными провайдерами — такими как Google, Microsoft и Amazon — которые борются за лидерство в инфраструктуре для искусственного интеллекта.