Amazon Web Services (AWS) a présenté une solution de refroidissement révolutionnaire pour relever l’un des défis d’infrastructure les plus pressants de l’IA : la gestion de la chaleur considérable générée par les processeurs d’IA les plus puissants du marché.
L’In-Row Heat Exchanger (IRHX) incarne l’approche sur mesure d’AWS pour le refroidissement de la dernière génération de processeurs graphiques (GPU) de Nvidia, essentiels à l’entraînement et à l’exécution de grands modèles d’IA, mais extrêmement énergivores. Les systèmes de refroidissement par air traditionnels, adaptés aux générations précédentes de GPU, ne suffisent tout simplement pas à dissiper la chaleur produite par les puces basées sur Blackwell de Nvidia.
« Ils occuperaient trop d’espace au sol dans les centres de données ou augmenteraient considérablement la consommation d’eau », explique Dave Brown, vice-président des services de calcul et d’apprentissage automatique chez AWS, à propos de l’insuffisance des solutions de refroidissement existantes. L’IRHX répond à ces limites en faisant circuler un liquide refroidi à proximité des rangées de serveurs via un système d’unités de pompage, d’armoires de distribution d’eau et de batteries de ventilation, éliminant efficacement la chaleur des GPU densément regroupés sans nécessiter de refonte majeure des centres de données.
Cette technologie de refroidissement fonctionne de concert avec les nouvelles instances P6e d’AWS, qui exploitent la plateforme Nvidia GB200 NVL72 — un système de calcul haute performance intégrant 72 GPU Blackwell interconnectés dans une seule baie. Cette configuration délivre 360 pétaflops de puissance de calcul et plus de 13 To de mémoire, permettant aux clients d’entraîner des modèles d’IA bien plus volumineux, plus rapidement et plus efficacement.
Au-delà des gains de performance, l’IRHX utilise un mécanisme de refroidissement en « boucle fermée » qui recycle le liquide de refroidissement sans augmenter la consommation d’eau, ce qui le rend respectueux de l’environnement. AWS estime que ses nouveaux systèmes de refroidissement peuvent réduire la consommation d’énergie mécanique jusqu’à 46 % lors des pics de refroidissement par rapport aux conceptions précédentes.
Le développement de l’IRHX s’inscrit dans la stratégie plus large d’AWS visant à concevoir des composants d’infrastructure sur mesure. Ces dernières années, l’entreprise a massivement investi dans la création de ses propres puces, systèmes de stockage et équipements réseau. Cette démarche s’est révélée financièrement avantageuse : au premier trimestre 2025, AWS a enregistré sa plus forte marge opérationnelle depuis la création de la division.
Alors que d’autres géants technologiques tels que Microsoft, Google et Meta poursuivent des stratégies similaires de matériel personnalisé pour les charges de travail IA, AWS conserve un avantage concurrentiel grâce à son vaste réseau mondial de centres de données et à son expérience dans le déploiement de matériel sur mesure à grande échelle. La technologie IRHX renforce encore la position d’AWS comme leader de l’infrastructure IA, rendant le calcul avancé en intelligence artificielle plus efficace, durable et accessible.