A Amazon Web Services (AWS) apresentou uma solução de arrefecimento inovadora para enfrentar um dos maiores desafios infraestruturais da inteligência artificial: gerir o calor intenso gerado pelos processadores de IA mais potentes da atualidade.
O In-Row Heat Exchanger (IRHX) representa a abordagem personalizada da AWS para o arrefecimento das mais recentes unidades de processamento gráfico (GPUs) da Nvidia, essenciais para treinar e executar grandes modelos de IA, mas que consomem enormes quantidades de energia. Os sistemas tradicionais de arrefecimento a ar, adequados para gerações anteriores de GPUs, já não conseguem responder às exigências térmicas dos chips baseados na arquitetura Blackwell da Nvidia.
"Ocupavam demasiado espaço no chão do centro de dados ou aumentavam substancialmente o uso de água", explicou Dave Brown, Vice-Presidente de Serviços de Computação e Aprendizagem Automática da AWS, sobre o motivo pelo qual as soluções de arrefecimento existentes se tornaram inadequadas. O IRHX supera estas limitações ao fazer circular líquido refrigerado junto às filas de servidores, através de um sistema de unidades de bombagem, armários de distribuição de água e serpentinas com ventoinhas, removendo eficazmente o calor das GPUs densamente agrupadas sem necessidade de uma remodelação total dos centros de dados.
Esta tecnologia de arrefecimento funciona em conjunto com as recém-lançadas instâncias P6e da AWS, que recorrem à plataforma GB200 NVL72 da Nvidia — um sistema de supercomputação que integra 72 GPUs Blackwell interligadas num único rack. Esta configuração oferece 360 petaflops de poder computacional e mais de 13 TB de memória, permitindo aos clientes treinar modelos de IA muito maiores de forma mais rápida e eficiente.
Para além dos benefícios de desempenho, o IRHX utiliza um mecanismo de arrefecimento "em circuito fechado" que recircula o refrigerante sem aumentar o consumo de água, tornando-o ambientalmente sustentável. A AWS estima que os seus sistemas de arrefecimento mais recentes podem reduzir o consumo de energia mecânica até 46% durante condições máximas de arrefecimento, em comparação com os designs anteriores.
O desenvolvimento do IRHX está alinhado com a estratégia mais ampla da AWS de criar componentes de infraestrutura personalizados. Nos últimos anos, a empresa investiu fortemente no desenvolvimento dos seus próprios chips, sistemas de armazenamento e equipamentos de rede. Esta abordagem tem-se revelado financeiramente vantajosa — no primeiro trimestre de 2025, a AWS atingiu a sua maior margem operacional desde a criação da unidade.
Embora outros gigantes tecnológicos como a Microsoft, Google e Meta estejam a seguir estratégias semelhantes de hardware personalizado para cargas de trabalho de IA, a AWS mantém uma vantagem competitiva graças à sua vasta rede global de centros de dados e à experiência na implementação de hardware personalizado em grande escala. A tecnologia IRHX reforça ainda mais a posição da AWS como líder em infraestrutura de IA, tornando a computação avançada de IA mais eficiente, sustentável e acessível.