OpenAI teste les TPU de Google pour lutter contre la hausse des coûts d’inférence de l’IA

OpenAI a commencé à tester les Tensor Processing Units (TPU) de Google afin d’explorer des alternatives pour gérer l’augmentation des coûts d’inférence de l’intelligence artificielle, qui représentent désormais plus de 50 % de son budget informatique. Bien que cela ne signifie pas un déploiement massif immédiat, cette initiative stratégique marque la première utilisation significative par OpenAI de matériel autre que celui de NVIDIA et indique une volonté de s’éloigner de la dépendance exclusive à l’infrastructure de Microsoft. Cette démarche pourrait potentiellement bouleverser le paysage du matériel IA en remettant en cause la domination de NVIDIA et en créant de nouvelles dynamiques concurrentielles entre les grands acteurs technologiques.

OpenAI, l’un des plus grands clients mondiaux des unités de traitement graphique (GPU) de NVIDIA, a commencé à tester les Tensor Processing Units (TPU) de Google pour alimenter ses systèmes d’intelligence artificielle, y compris ChatGPT. Cette initiative intervient alors que l’entreprise fait face à des dépenses informatiques croissantes et cherche des solutions plus économiques pour ses opérations d’IA en pleine expansion.

Selon des analystes du secteur, l’inférence — le processus par lequel les modèles d’IA utilisent les connaissances acquises pour faire des prédictions ou prendre des décisions — représente désormais plus de 50 % du budget informatique d’OpenAI. Les TPU, en particulier les générations plus anciennes, offrent un coût par inférence nettement inférieur à celui des GPU NVIDIA, ce qui en fait une alternative attrayante malgré des performances de pointe potentiellement inférieures à celles des puces NVIDIA les plus récentes.

« Même si les anciens TPU n’atteignent pas les performances maximales des dernières puces Nvidia, leur architecture dédiée minimise le gaspillage d’énergie et les ressources inactives, ce qui les rend plus rentables à grande échelle », explique Charlie Dai, vice-président et analyste principal chez Forrester. Selon les analyses du secteur, Google pourrait obtenir une puissance de calcul IA pour environ 20 % du coût supporté par ceux qui achètent des GPU NVIDIA haut de gamme, ce qui impliquerait un avantage d’efficacité de 4 à 6 fois.

Cependant, OpenAI a précisé qu’il n’envisageait pas pour l’instant de déploiement massif des TPU. Un porte-parole a déclaré à Reuters que la société en est « aux premiers tests avec certains TPU de Google » mais qu’elle n’a « actuellement aucun projet de déploiement à grande échelle ». Cette approche prudente reflète les défis techniques importants liés à la transition de l’infrastructure, la pile logicielle d’OpenAI ayant été principalement optimisée pour les GPU.

Au-delà des considérations de coûts, cette démarche représente une diversification stratégique des sources de calcul d’OpenAI au-delà de Microsoft, qui était jusqu’en janvier 2025 son unique fournisseur d’infrastructure de centres de données. L’entreprise a déjà noué des partenariats avec Oracle et CoreWeave dans le cadre de son programme d’infrastructure Stargate et développe son propre processeur IA personnalisé, dont la première version devrait être finalisée plus tard cette année.

Les répercussions sur le marché du matériel IA pourraient être majeures. Si elle réussit, l’adoption des TPU par OpenAI pourrait valider le matériel de Google comme alternative crédible à la quasi-hégémonie de NVIDIA dans le calcul IA haute performance. Cela pourrait pousser NVIDIA à innover ou à revoir ses prix, tout en créant de nouvelles dynamiques concurrentielles entre les fournisseurs de cloud comme Google, Microsoft et Amazon, qui se disputent la domination de l’infrastructure IA.

OpenAI teste les TPU de Google pour lutter contre la hausse des coûts d’inférence de l’IA

Latest News

L’IA entre dans le grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI dévoile un hub d’actualités IA pour les professionnels de la tech

L’informatique quantique réalise une avancée historique avec une accélération inconditionnelle

OpenAI rejette les actions tokenisées non autorisées de Robinhood

Microsoft supprime 9 000 emplois tout en misant sur l’IA

Meta lance une offensive sur l’IA avec un raid de talents à 14 milliards de dollars chez ses rivaux

Google et Pearson unissent leurs forces pour transformer l'éducation primaire et secondaire grâce à l'IA

Gartner : 40 % des projets d’IA agentique voués à l’échec d’ici 2027

Google élargit son portefeuille d’IA avec Gemini 2.5 et Imagen 4

OpenAI reporte la sortie de son modèle open source face à une concurrence accrue dans l’IA

OpenAI teste les TPU de Google pour lutter contre la hausse des coûts d’inférence de l’IA

Related Articles

L’IA entre dans le grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI dévoile un hub d’actualités IA pour les professionnels de la tech

OpenAI rejette les actions tokenisées non autorisées de Robinhood

Microsoft supprime 9 000 emplois tout en misant sur l’IA

Meta lance une offensive sur l’IA avec un raid de talents à 14 milliards de dollars chez ses rivaux

Latest News

L’IA entre dans le grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI dévoile un hub d’actualités IA pour les professionnels de la tech

L’informatique quantique réalise une avancée historique avec une accélération inconditionnelle

OpenAI rejette les actions tokenisées non autorisées de Robinhood

Microsoft supprime 9 000 emplois tout en misant sur l’IA

Meta lance une offensive sur l’IA avec un raid de talents à 14 milliards de dollars chez ses rivaux

Google et Pearson unissent leurs forces pour transformer l'éducation primaire et secondaire grâce à l'IA

Gartner : 40 % des projets d’IA agentique voués à l’échec d’ici 2027

Google élargit son portefeuille d’IA avec Gemini 2.5 et Imagen 4

OpenAI reporte la sortie de son modèle open source face à une concurrence accrue dans l’IA