Amazon Web Services (AWS) представи революционно охладително решение за справяне с едно от най-належащите инфраструктурни предизвикателства в сферата на изкуствения интелект: управлението на огромната топлина, генерирана от съвременните мощни AI процесори.
In-Row Heat Exchanger (IRHX) е персонализираният подход на AWS към охлаждането на най-новото поколение графични процесори (GPU) на Nvidia, които са от съществено значение за обучението и изпълнението на големи AI модели, но консумират огромни количества енергия. Традиционните въздушни охладителни системи, които бяха достатъчни за предишните поколения GPU, вече не могат да се справят с топлинните изисквания на чиповете, базирани на Nvidia Blackwell.
„Те биха заели твърде много пространство в центровете за данни или биха увеличили значително водната консумация“, обяснява Дейв Браун, вицепрезидент на отдел „Изчисления и машинно обучение“ в AWS, относно причините, поради които съществуващите охладителни решения са неадекватни. IRHX преодолява тези ограничения чрез циркулация на охладена течност в близост до редовете със сървъри посредством система от помпени агрегати, разпределителни шкафове за вода и вентилаторни топлообменници, като ефективно отвежда топлината от гъсто разположените GPU без необходимост от цялостно преустройство на центровете за данни.
Охладителната технология работи в синхрон с новите P6e инстанции на AWS, които използват платформата Nvidia GB200 NVL72 – суперкомпютърна система, съдържаща 72 Blackwell GPU, свързани в един рак. Тази конфигурация осигурява 360 петафлопа изчислителна мощ и над 13TB памет, позволявайки на клиентите да обучават много по-големи AI модели по-бързо и ефективно.
Освен предимствата по отношение на производителността, IRHX използва „затворен цикъл“ на охлаждане, при който охладителната течност се рециркулира без увеличаване на водната консумация, което го прави екологично устойчиво решение. AWS изчислява, че новите им охладителни системи могат да намалят механичната консумация на енергия с до 46% при пикови условия на охлаждане в сравнение с предишни дизайни.
Разработката на IRHX е в синхрон с по-широката стратегия на AWS за създаване на персонализирани инфраструктурни компоненти. През последните години компанията инвестира сериозно в разработването на собствени чипове, системи за съхранение и мрежово оборудване. Този подход се оказва финансово изгоден – през първото тримесечие на 2025 г. AWS постига най-високия си оперативен марж от създаването на подразделението.
Докато други технологични гиганти като Microsoft, Google и Meta също разработват персонализиран хардуер за AI натоварвания, AWS запазва конкурентно предимство благодарение на глобалната си мрежа от центрове за данни и опита си в мащабното внедряване на персонализиран хардуер. Технологията IRHX допълнително укрепва позицията на AWS като лидер в AI инфраструктурата, правейки напредналите AI изчисления по-ефективни, устойчиви и достъпни.