menu
close

Les géants du cloud accélèrent la course au déploiement de puces IA sur mesure

Google a commencé le déploiement massif de ses puces TPU v6e dédiées à l’inférence IA, devenues grand public au premier semestre 2025. Parallèlement, AWS se concentre sur la montée en puissance de sa plateforme Trainium v2 tout en développant plusieurs variantes de Trainium v3 pour une production prévue en 2026 ; AWS devrait ainsi dominer cette année les livraisons de puces IA propriétaires parmi les fournisseurs de cloud américains. Cette tendance marque un tournant majeur, les principaux acteurs du cloud développant et déployant de plus en plus leurs propres accélérateurs IA au lieu de s’appuyer uniquement sur des solutions tierces.
Les géants du cloud accélèrent la course au déploiement de puces IA sur mesure

Les principaux fournisseurs de services cloud accélèrent rapidement leurs stratégies autour des puces IA sur mesure, redéfinissant le paysage concurrentiel de l’infrastructure IA.

En tant qu’entreprise ayant un taux d’adoption relativement élevé de puces développées en interne, Google a commencé le déploiement massif de ses puces TPU v6e, axées sur l’inférence IA, qui sont devenues la norme au premier semestre 2025. TrendForce souligne que la croissance des serveurs de Google est principalement portée par des projets de cloud souverain et une nouvelle capacité de centres de données en Asie du Sud-Est. Le TPU v6e, également appelé Trillium, représente une avancée majeure dans la gamme matérielle IA de Google, affichant une performance de calcul de pointe multipliée par 4,7 par rapport au TPU v5e, avec une capacité et une bande passante de mémoire à large bande passante (HBM) doublées.

Amazon Web Services (AWS) se concentre sur la montée en charge de sa plateforme Trainium v2 développée en interne, tout en élaborant plusieurs variantes de Trainium v3, dont la production de masse est prévue pour 2026. AWS devrait dominer cette année les livraisons de puces IA propriétaires parmi les fournisseurs de cloud américains, doublant ses volumes de 2024. La puce AWS Trainium2 offre jusqu’à 4 fois les performances de la première génération Trainium, avec des instances Amazon EC2 Trn2 spécialement conçues pour l’IA générative et optimisées pour l’entraînement et le déploiement de modèles comptant des centaines de milliards à plus d’un trillion de paramètres.

Oracle, comparé aux autres grands fournisseurs de cloud, privilégie davantage l’achat de serveurs IA et de serveurs de bases de données en mémoire (IMDB). En 2025, Oracle prévoit d’intensifier le déploiement de son infrastructure de serveurs IA et d’intégrer ses services de bases de données cloud avec des applications IA. Larry Ellison, cofondateur d’Oracle, a souligné la position unique de l’entreprise grâce à la quantité massive de données d’entreprise stockées dans ses bases. La dernière version de sa base de données, Oracle 23ai, est spécifiquement conçue pour répondre aux besoins des charges de travail IA et serait « la seule base de données capable de rendre instantanément toutes les données clients accessibles à tous les modèles IA populaires tout en préservant pleinement la confidentialité des clients ».

La tendance vers des puces IA sur mesure représente un virage stratégique pour les fournisseurs de cloud, cherchant à optimiser les performances tout en réduisant les coûts et la dépendance vis-à-vis de fournisseurs tiers. Ces accélérateurs sur mesure, comme AWS Trainium et les TPU de Google, sont en concurrence directe avec les GPU NVIDIA A100/H100, mais se distinguent par leur intégration transparente au cloud, leur tarification prévisible et une infrastructure optimisée.

Selon la dernière analyse de TrendForce, les principaux fournisseurs de cloud nord-américains restent les moteurs de la croissance du marché des serveurs IA, une demande soutenue provenant également des centres de données de niveau 2 et des projets de cloud souverain au Moyen-Orient et en Europe. Malgré les tensions géopolitiques et les restrictions américaines à l’exportation qui affectent le marché chinois, les livraisons mondiales de serveurs IA devraient croître de 24,3 % sur un an. Cette croissance soutenue souligne à quel point l’IA devient centrale dans les offres de services cloud et stimule des investissements majeurs dans l’infrastructure à l’échelle du secteur.

Source:

Latest News