Les principaux fournisseurs de services cloud accélèrent rapidement leurs stratégies de développement de puces IA sur mesure, redéfinissant le paysage concurrentiel de l’infrastructure IA.
En tant qu’entreprise ayant un taux d’adoption relativement élevé de puces développées en interne, Google a commencé le déploiement massif de ses puces TPU v6e axées sur l’inférence IA, qui sont devenues courantes au premier semestre de 2025. TrendForce souligne que la croissance des serveurs de Google est principalement alimentée par des projets de cloud souverain et par de nouvelles capacités de centres de données en Asie du Sud-Est. La TPU v6e, aussi appelée Trillium, représente une avancée majeure dans la gamme matérielle IA de Google, offrant une performance de calcul de pointe 4,7 fois supérieure par puce par rapport à la TPU v5e, avec une capacité et une bande passante de mémoire à haute vitesse (HBM) doublées.
Amazon Web Services (AWS) se concentre sur la montée en puissance de sa plateforme Trainium v2 développée en interne, tout en développant plusieurs variantes de Trainium v3, dont la production de masse est prévue pour 2026. AWS devrait dominer tous les fournisseurs américains de services cloud (CSP) en termes d’expéditions de puces IA internes cette année, doublant ses volumes de 2024. La puce AWS Trainium2 offre jusqu’à 4 fois la performance de la première génération de Trainium, et les instances Amazon EC2 Trn2 basées sur Trainium2 sont conçues spécifiquement pour l’IA générative et optimisées pour l’entraînement et le déploiement de modèles comportant des centaines de milliards à plus d’un trillion de paramètres.
Comparativement aux autres grands fournisseurs, Oracle mise davantage sur l’achat de serveurs IA et de serveurs de bases de données en mémoire (IMDB). En 2025, Oracle prévoit d’accélérer le déploiement de son infrastructure de serveurs IA et d’intégrer ses principaux services de bases de données cloud avec des applications IA. Larry Ellison, cofondateur d’Oracle, a souligné la position unique de l’entreprise grâce à la quantité massive de données d’entreprise stockées dans ses bases de données. La dernière version de sa base de données, Oracle 23ai, est spécifiquement adaptée aux besoins des charges de travail IA et serait « la seule base de données capable de rendre toutes les données clients instantanément accessibles à tous les modèles IA populaires tout en préservant entièrement la confidentialité des clients ».
La tendance vers les puces IA sur mesure représente un virage stratégique pour les fournisseurs cloud cherchant à optimiser la performance tout en réduisant les coûts et la dépendance envers les fournisseurs tiers. Ces accélérateurs sur mesure, comme AWS Trainium et les TPU de Google, rivalisent directement avec les GPU A100/H100 de NVIDIA, mais se distinguent par leur intégration transparente au cloud, une tarification prévisible et une infrastructure optimisée.
Selon la dernière analyse de TrendForce, les principaux fournisseurs nord-américains de services cloud demeurent les moteurs principaux de la croissance du marché des serveurs IA, avec une demande soutenue également stimulée par les centres de données de niveau 2 et les projets de cloud souverain au Moyen-Orient et en Europe. Malgré les tensions géopolitiques et les restrictions américaines à l’exportation qui affectent le marché chinois, les expéditions mondiales de serveurs IA devraient croître de 24,3 % d’une année à l’autre. Cette croissance robuste souligne à quel point l’IA devient centrale dans les offres de services cloud et stimule d’importants investissements en infrastructure dans toute l’industrie.