Les principaux fournisseurs de services cloud accélèrent rapidement leurs stratégies autour des puces IA sur mesure, redéfinissant le paysage concurrentiel de l’infrastructure IA.
En tant qu’entreprise ayant un taux d’adoption relativement élevé de puces développées en interne, Google a commencé le déploiement massif de ses puces TPU v6e, axées sur l’inférence IA, qui sont devenues la norme au premier semestre 2025. TrendForce souligne que la croissance des serveurs de Google est principalement portée par des projets de cloud souverain et une nouvelle capacité de centres de données en Asie du Sud-Est. Le TPU v6e, également appelé Trillium, représente une avancée majeure dans la gamme matérielle IA de Google, affichant une performance de calcul de pointe multipliée par 4,7 par rapport au TPU v5e, avec une capacité et une bande passante de mémoire à large bande passante (HBM) doublées.
Amazon Web Services (AWS) se concentre sur la montée en charge de sa plateforme Trainium v2 développée en interne, tout en élaborant plusieurs variantes de Trainium v3, dont la production de masse est prévue pour 2026. AWS devrait dominer cette année les livraisons de puces IA propriétaires parmi les fournisseurs de cloud américains, doublant ses volumes de 2024. La puce AWS Trainium2 offre jusqu’à 4 fois les performances de la première génération Trainium, avec des instances Amazon EC2 Trn2 spécialement conçues pour l’IA générative et optimisées pour l’entraînement et le déploiement de modèles comptant des centaines de milliards à plus d’un trillion de paramètres.
Oracle, comparé aux autres grands fournisseurs de cloud, privilégie davantage l’achat de serveurs IA et de serveurs de bases de données en mémoire (IMDB). En 2025, Oracle prévoit d’intensifier le déploiement de son infrastructure de serveurs IA et d’intégrer ses services de bases de données cloud avec des applications IA. Larry Ellison, cofondateur d’Oracle, a souligné la position unique de l’entreprise grâce à la quantité massive de données d’entreprise stockées dans ses bases. La dernière version de sa base de données, Oracle 23ai, est spécifiquement conçue pour répondre aux besoins des charges de travail IA et serait « la seule base de données capable de rendre instantanément toutes les données clients accessibles à tous les modèles IA populaires tout en préservant pleinement la confidentialité des clients ».
La tendance vers des puces IA sur mesure représente un virage stratégique pour les fournisseurs de cloud, cherchant à optimiser les performances tout en réduisant les coûts et la dépendance vis-à-vis de fournisseurs tiers. Ces accélérateurs sur mesure, comme AWS Trainium et les TPU de Google, sont en concurrence directe avec les GPU NVIDIA A100/H100, mais se distinguent par leur intégration transparente au cloud, leur tarification prévisible et une infrastructure optimisée.
Selon la dernière analyse de TrendForce, les principaux fournisseurs de cloud nord-américains restent les moteurs de la croissance du marché des serveurs IA, une demande soutenue provenant également des centres de données de niveau 2 et des projets de cloud souverain au Moyen-Orient et en Europe. Malgré les tensions géopolitiques et les restrictions américaines à l’exportation qui affectent le marché chinois, les livraisons mondiales de serveurs IA devraient croître de 24,3 % sur un an. Cette croissance soutenue souligne à quel point l’IA devient centrale dans les offres de services cloud et stimule des investissements majeurs dans l’infrastructure à l’échelle du secteur.