OpenAI teste les TPU de Google pour contrer la hausse des coûts d’inférence en IA

OpenAI a commencé à tester les unités de traitement tensoriel (TPU) de Google alors qu’elle explore des alternatives pour gérer la flambée des coûts d’inférence en intelligence artificielle, qui représentent désormais plus de 50 % de son budget informatique. Bien que cela ne signifie pas un déploiement massif immédiat, cette décision stratégique marque la première utilisation significative par OpenAI de matériel autre que NVIDIA et indique un éloignement de la dépendance exclusive à l’infrastructure de Microsoft. Cette exploration pourrait potentiellement transformer le paysage du matériel d’IA en remettant en question la domination de NVIDIA et en créant de nouvelles dynamiques concurrentielles parmi les grands fournisseurs technologiques.

OpenAI, l’un des plus grands clients mondiaux des unités de traitement graphique (GPU) de NVIDIA, a commencé à tester les unités de traitement tensoriel (TPU) de Google pour alimenter ses systèmes d’IA, y compris ChatGPT. Cette initiative survient alors que l’entreprise fait face à des dépenses informatiques croissantes et cherche des solutions plus économiques pour soutenir l’expansion de ses opérations en IA.

Selon des analystes du secteur, l’inférence — le processus par lequel les modèles d’IA utilisent les connaissances acquises pour faire des prédictions ou prendre des décisions — représente maintenant plus de 50 % du budget informatique d’OpenAI. Les TPU, en particulier les générations plus anciennes, offrent un coût par inférence nettement inférieur à celui des GPU de NVIDIA, ce qui en fait une alternative attrayante, même si leur performance maximale n’égale pas celle des puces NVIDIA les plus récentes.

« Bien que les anciens TPU n’atteignent pas les performances maximales des nouvelles puces de Nvidia, leur architecture dédiée minimise le gaspillage d’énergie et les ressources inactives, ce qui les rend plus rentables à grande échelle », explique Charlie Dai, vice-président et analyste principal chez Forrester. Selon les analyses du secteur, Google pourrait obtenir de la puissance de calcul en IA à environ 20 % du coût encouru par ceux qui achètent des GPU NVIDIA haut de gamme, ce qui suggère un avantage d’efficacité de 4 à 6 fois sur le plan des coûts.

Cependant, OpenAI a précisé qu’elle n’a pas l’intention de déployer massivement les TPU dans l’immédiat. Un porte-parole a déclaré à Reuters que la société en est « aux premiers tests avec certains TPU de Google », mais qu’elle « n’a actuellement aucun plan pour les déployer à grande échelle ». Cette approche prudente reflète les défis techniques importants liés à la transition de l’infrastructure, puisque la pile logicielle d’OpenAI a été principalement optimisée pour les GPU.

Au-delà des considérations de coûts, cette démarche représente une diversification stratégique des sources de calcul d’OpenAI, au-delà de Microsoft, qui était jusqu’en janvier 2025 son fournisseur exclusif d’infrastructures de centres de données. L’entreprise a déjà établi des partenariats avec Oracle et CoreWeave dans le cadre de son programme d’infrastructure Stargate et développe également son propre processeur d’IA personnalisé, dont la première version devrait voir le jour plus tard cette année.

Les répercussions sur le marché du matériel d’IA pourraient être majeures. Si elle réussit, l’adoption des TPU par OpenAI pourrait valider le matériel de Google comme une alternative crédible à la quasi-monopole de NVIDIA dans le calcul haute performance pour l’IA. Cela pourrait pousser NVIDIA à innover ou à ajuster ses prix, tout en créant de nouvelles dynamiques concurrentielles entre les fournisseurs de services infonuagiques comme Google, Microsoft et Amazon, qui rivalisent pour dominer l’infrastructure de l’IA.

OpenAI teste les TPU de Google pour contrer la hausse des coûts d’inférence en IA

Latest News

L’IA devient grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI lance un centre de nouvelles sur l’IA pour les professionnels de la technologie

L’informatique quantique réalise une accélération historique inconditionnelle

OpenAI rejette les actions tokenisées non autorisées de Robinhood

Microsoft supprime 9 000 emplois tout en misant sur l’IA

Meta lance une offensive majeure en IA avec un raid de talents de 14 G$ chez ses rivaux

Google et Pearson unissent leurs forces pour transformer l’éducation primaire et secondaire grâce à l’IA

Gartner : 40 % des projets d’IA agentique voués à l’échec d’ici 2027

Google élargit son portefeuille d’IA avec Gemini 2.5 et Imagen 4

OpenAI reporte le lancement de son modèle open source dans un contexte de concurrence accrue en IA

OpenAI teste les TPU de Google pour contrer la hausse des coûts d’inférence en IA

Related Articles

L’IA devient grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI lance un centre de nouvelles sur l’IA pour les professionnels de la technologie

OpenAI rejette les actions tokenisées non autorisées de Robinhood

Microsoft supprime 9 000 emplois tout en misant sur l’IA

Meta lance une offensive majeure en IA avec un raid de talents de 14 G$ chez ses rivaux

Latest News

L’IA devient grand public : 1,8 milliard d’utilisateurs dans le monde, selon un rapport

OpenTools.AI lance un centre de nouvelles sur l’IA pour les professionnels de la technologie

L’informatique quantique réalise une accélération historique inconditionnelle

OpenAI rejette les actions tokenisées non autorisées de Robinhood

Microsoft supprime 9 000 emplois tout en misant sur l’IA

Meta lance une offensive majeure en IA avec un raid de talents de 14 G$ chez ses rivaux

Google et Pearson unissent leurs forces pour transformer l’éducation primaire et secondaire grâce à l’IA

Gartner : 40 % des projets d’IA agentique voués à l’échec d’ici 2027

Google élargit son portefeuille d’IA avec Gemini 2.5 et Imagen 4

OpenAI reporte le lancement de son modèle open source dans un contexte de concurrence accrue en IA