Amazon Web Services (AWS) представила революционное решение для одной из ключевых инфраструктурных проблем искусственного интеллекта — управления огромным тепловыделением современных мощных процессоров ИИ.
In-Row Heat Exchanger (IRHX) — это собственная разработка AWS для охлаждения новейших графических процессоров (GPU) Nvidia, которые необходимы для обучения и запуска крупных моделей ИИ, но при этом потребляют колоссальное количество энергии. Традиционные воздушные системы охлаждения, подходившие для предыдущих поколений GPU, уже не справляются с тепловой нагрузкой чипов на базе Nvidia Blackwell.
«Они занимали бы слишком много места на полу дата-центра или существенно увеличили бы расход воды», — объяснил Дэйв Браун, вице-президент по вычислениям и сервисам машинного обучения AWS, говоря о причинах, по которым существующие решения оказались недостаточными. IRHX решает эти ограничения, циркулируя охлаждённую жидкость вблизи серверных рядов через систему насосных блоков, шкафов распределения воды и вентиляторных теплообменников, эффективно отводя тепло от плотно размещённых GPU без необходимости полной перестройки дата-центров.
Технология охлаждения работает в тандеме с новыми инстансами AWS P6e, использующими платформу Nvidia GB200 NVL72 — суперкомпьютерную систему, включающую 72 GPU Blackwell, объединённых в одной стойке. Такая конфигурация обеспечивает 360 петафлопс вычислительной мощности и более 13 ТБ памяти, позволяя клиентам быстрее и эффективнее обучать гораздо более крупные модели ИИ.
Помимо повышения производительности, IRHX использует «замкнутый цикл» охлаждения, при котором охлаждающая жидкость циркулирует без увеличения расхода воды, что делает систему экологически устойчивой. По оценкам AWS, новые системы охлаждения позволяют снизить механическое энергопотребление до 46% в пиковых условиях по сравнению с предыдущими решениями.
Разработка IRHX соответствует общей стратегии AWS по созданию собственных инфраструктурных компонентов. В последние годы компания активно инвестирует в разработку собственных чипов, систем хранения и сетевого оборудования. Такой подход оказался финансово выгодным: в первом квартале 2025 года AWS достигла самой высокой операционной маржи с момента основания подразделения.
В то время как другие технологические гиганты — Microsoft, Google и Meta — также разрабатывают собственное оборудование для ИИ-нагрузок, AWS сохраняет конкурентное преимущество благодаря широкой глобальной сети дата-центров и опыту масштабного внедрения кастомных решений. Технология IRHX ещё больше укрепляет позиции AWS как лидера в области ИИ-инфраструктуры, делая передовые вычисления для искусственного интеллекта более эффективными, экологичными и доступными.