Les géants du cloud accélèrent la course au déploiement de puces IA sur mesure

Google a commencé le déploiement massif de ses puces TPU v6e pour l’inférence IA, qui sont devenues courantes au premier semestre de 2025. Pendant ce temps, AWS se concentre sur la montée en puissance de sa plateforme Trainium v2 tout en développant plusieurs variantes de Trainium v3 pour une production prévue en 2026. AWS devrait ainsi dominer tous les fournisseurs américains de services cloud en termes d’expéditions de puces IA développées en interne cette année. Cette tendance marque un virage important alors que les principaux fournisseurs cloud développent et déploient de plus en plus leurs propres accélérateurs IA sur mesure, au lieu de s’appuyer uniquement sur des solutions tierces.

Les principaux fournisseurs de services cloud accélèrent rapidement leurs stratégies de développement de puces IA sur mesure, redéfinissant le paysage concurrentiel de l’infrastructure IA.

En tant qu’entreprise ayant un taux d’adoption relativement élevé de puces développées en interne, Google a commencé le déploiement massif de ses puces TPU v6e axées sur l’inférence IA, qui sont devenues courantes au premier semestre de 2025. TrendForce souligne que la croissance des serveurs de Google est principalement alimentée par des projets de cloud souverain et par de nouvelles capacités de centres de données en Asie du Sud-Est. La TPU v6e, aussi appelée Trillium, représente une avancée majeure dans la gamme matérielle IA de Google, offrant une performance de calcul de pointe 4,7 fois supérieure par puce par rapport à la TPU v5e, avec une capacité et une bande passante de mémoire à haute vitesse (HBM) doublées.

Amazon Web Services (AWS) se concentre sur la montée en puissance de sa plateforme Trainium v2 développée en interne, tout en développant plusieurs variantes de Trainium v3, dont la production de masse est prévue pour 2026. AWS devrait dominer tous les fournisseurs américains de services cloud (CSP) en termes d’expéditions de puces IA internes cette année, doublant ses volumes de 2024. La puce AWS Trainium2 offre jusqu’à 4 fois la performance de la première génération de Trainium, et les instances Amazon EC2 Trn2 basées sur Trainium2 sont conçues spécifiquement pour l’IA générative et optimisées pour l’entraînement et le déploiement de modèles comportant des centaines de milliards à plus d’un trillion de paramètres.

Comparativement aux autres grands fournisseurs, Oracle mise davantage sur l’achat de serveurs IA et de serveurs de bases de données en mémoire (IMDB). En 2025, Oracle prévoit d’accélérer le déploiement de son infrastructure de serveurs IA et d’intégrer ses principaux services de bases de données cloud avec des applications IA. Larry Ellison, cofondateur d’Oracle, a souligné la position unique de l’entreprise grâce à la quantité massive de données d’entreprise stockées dans ses bases de données. La dernière version de sa base de données, Oracle 23ai, est spécifiquement adaptée aux besoins des charges de travail IA et serait « la seule base de données capable de rendre toutes les données clients instantanément accessibles à tous les modèles IA populaires tout en préservant entièrement la confidentialité des clients ».

La tendance vers les puces IA sur mesure représente un virage stratégique pour les fournisseurs cloud cherchant à optimiser la performance tout en réduisant les coûts et la dépendance envers les fournisseurs tiers. Ces accélérateurs sur mesure, comme AWS Trainium et les TPU de Google, rivalisent directement avec les GPU A100/H100 de NVIDIA, mais se distinguent par leur intégration transparente au cloud, une tarification prévisible et une infrastructure optimisée.

Selon la dernière analyse de TrendForce, les principaux fournisseurs nord-américains de services cloud demeurent les moteurs principaux de la croissance du marché des serveurs IA, avec une demande soutenue également stimulée par les centres de données de niveau 2 et les projets de cloud souverain au Moyen-Orient et en Europe. Malgré les tensions géopolitiques et les restrictions américaines à l’exportation qui affectent le marché chinois, les expéditions mondiales de serveurs IA devraient croître de 24,3 % d’une année à l’autre. Cette croissance robuste souligne à quel point l’IA devient centrale dans les offres de services cloud et stimule d’importants investissements en infrastructure dans toute l’industrie.

Source:

Les géants du cloud accélèrent la course au déploiement de puces IA sur mesure

Latest News

Singapour exploite l’IA pour révolutionner la découverte en science des matériaux

L’informatique quantique atteint le « Saint Graal » de l’accélération exponentielle

Meta débauche le chef de l’IA d’Apple dans un contexte de rivalité technologique accrue

OpenTools.ai lance un centre de nouvelles sur l’IA pour des mises à jour technologiques quotidiennes

Le modèle vidéo Firefly d’Adobe transforme les flux de travail créatifs

OpenTools.ai unifie les capacités de l’IA dans une nouvelle plateforme tout-en-un

Le Royaume-Uni innove en interdisant pénalement les contenus d’abus d’enfants générés par l’IA

Google étend la portée de Gemini grâce à l’intégration interapplications

Un robot d’échecs chinois propulsé par l’IA met en valeur la technologie éducative au Sommet de l’ONU

Elior Group et IBM déploient l’IA agentique pour transformer les services alimentaires

Les géants du cloud accélèrent la course au déploiement de puces IA sur mesure

Related Articles

Singapour exploite l’IA pour révolutionner la découverte en science des matériaux

OpenTools.ai lance un centre de nouvelles sur l’IA pour des mises à jour technologiques quotidiennes

Meta débauche le chef de l’IA d’Apple dans un contexte de rivalité technologique accrue

OpenTools.ai unifie les capacités de l’IA dans une nouvelle plateforme tout-en-un

Le modèle vidéo Firefly d’Adobe transforme les flux de travail créatifs

Latest News

Singapour exploite l’IA pour révolutionner la découverte en science des matériaux

L’informatique quantique atteint le « Saint Graal » de l’accélération exponentielle

Meta débauche le chef de l’IA d’Apple dans un contexte de rivalité technologique accrue

OpenTools.ai lance un centre de nouvelles sur l’IA pour des mises à jour technologiques quotidiennes

Le modèle vidéo Firefly d’Adobe transforme les flux de travail créatifs

OpenTools.ai unifie les capacités de l’IA dans une nouvelle plateforme tout-en-un

Le Royaume-Uni innove en interdisant pénalement les contenus d’abus d’enfants générés par l’IA

Google étend la portée de Gemini grâce à l’intégration interapplications

Un robot d’échecs chinois propulsé par l’IA met en valeur la technologie éducative au Sommet de l’ONU

Elior Group et IBM déploient l’IA agentique pour transformer les services alimentaires