menu
close

AWS Apresenta Sistema de Resfriamento Personalizado para Chips de IA de Próxima Geração

A Amazon Web Services desenvolveu o In-Row Heat Exchanger (IRHX), um sistema híbrido de resfriamento líquido-ar projetado especificamente para as GPUs Blackwell da Nvidia, que consomem muita energia em cargas de trabalho avançadas de IA. A solução inovadora resolve o problema do calor extremo gerado por racks de GPUs de alta densidade sem exigir grandes reformas nos data centers ou aumentar o consumo de água. Essa tecnologia permite que a AWS ofereça suas novas instâncias P6e, equipadas com a plataforma GB200 NVL72 da Nvidia, que reúne 72 GPUs interconectadas em um único rack para um poder computacional de IA sem precedentes.
AWS Apresenta Sistema de Resfriamento Personalizado para Chips de IA de Próxima Geração

A Amazon Web Services (AWS) apresentou uma solução inovadora de resfriamento para enfrentar um dos maiores desafios de infraestrutura da IA: gerenciar o calor intenso gerado pelos processadores de IA de última geração.

O In-Row Heat Exchanger (IRHX) representa a abordagem personalizada da AWS para resfriar as mais recentes unidades de processamento gráfico (GPUs) da Nvidia, essenciais para treinar e executar grandes modelos de IA, mas que consomem enormes quantidades de energia. Os sistemas tradicionais de resfriamento a ar, adequados para gerações anteriores de GPUs, simplesmente não conseguem lidar com as demandas térmicas dos chips baseados na arquitetura Blackwell da Nvidia.

"Eles ocupariam muito espaço no piso do data center ou aumentariam substancialmente o uso de água", explicou Dave Brown, vice-presidente de Serviços de Computação e Aprendizado de Máquina da AWS, sobre por que as soluções de resfriamento existentes eram inadequadas. O IRHX supera essas limitações ao circular líquido refrigerado próximo às fileiras de servidores, por meio de um sistema de unidades de bombeamento, gabinetes de distribuição de água e serpentinas com ventiladores, removendo de forma eficiente o calor das GPUs densamente agrupadas sem exigir uma reformulação completa dos data centers.

A tecnologia de resfriamento funciona em conjunto com as recém-lançadas instâncias P6e da AWS, que utilizam a plataforma GB200 NVL72 da Nvidia — um sistema de supercomputação que contém 72 GPUs Blackwell interconectadas em um único rack. Essa configuração oferece 360 petaflops de poder computacional e mais de 13 TB de memória, permitindo que os clientes treinem modelos de IA muito maiores de forma mais rápida e eficiente.

Além dos benefícios de desempenho, o IRHX utiliza um mecanismo de resfriamento em "circuito fechado" que recircula o líquido refrigerante sem aumentar o consumo de água, tornando-o ambientalmente sustentável. A AWS estima que seus sistemas de resfriamento mais recentes podem reduzir o consumo de energia mecânica em até 46% durante condições de resfriamento máximo em comparação com projetos anteriores.

O desenvolvimento do IRHX está alinhado com a estratégia mais ampla da AWS de criar componentes de infraestrutura personalizados. Nos últimos anos, a empresa investiu fortemente na criação de seus próprios chips, sistemas de armazenamento e equipamentos de rede. Essa abordagem tem se mostrado financeiramente vantajosa — no primeiro trimestre de 2025, a AWS alcançou sua maior margem operacional desde a criação da unidade.

Enquanto outros gigantes da tecnologia, como Microsoft, Google e Meta, também buscam estratégias de hardware personalizado para cargas de trabalho de IA, a AWS mantém uma vantagem competitiva graças à sua ampla presença global de data centers e à experiência em implantar hardware personalizado em grande escala. A tecnologia IRHX reforça ainda mais a posição da AWS como líder em infraestrutura de IA, tornando a computação avançada de IA mais eficiente, sustentável e acessível.

Source: Shrm

Latest News