В значим ход за справяне с нарастващия недостиг на GPU, който възпрепятства развитието на изкуствения интелект, NVIDIA обяви DGX Cloud Lepton по време на Computex 2025 в Тайван на 19 май. Платформата създава единен пазар, който свързва AI разработчици с GPU ресурси от множество облачни доставчици по целия свят.
Моментът е ключов, тъй като търсенето на GPU за обучение и внедряване на AI достигна безпрецедентни нива. Според анализатора от Gartner Чираг Декате: „Не само NVIDIA, но и цялата верига на доставки на NVIDIA едва смогва да отговори на търсенето, а търсенето далеч надвишава предлагането.“ DGX Cloud Lepton има за цел да реши този проблем, като агрегира GPU ресурси от различни доставчици.
Десет NVIDIA Cloud партньори (NCPs), сред които CoreWeave, Crusoe, Lambda и SoftBank, ще предлагат GPU с архитектури NVIDIA Blackwell и други чрез платформата. Разработчиците ще могат да получават изчислителен капацитет в конкретни региони както за нужди при поискване, така и за дългосрочни проекти, подкрепяйки стратегически и суверенни AI операции.
„NVIDIA DGX Cloud Lepton свързва нашата глобална мрежа от облачни доставчици на GPU с AI разработчиците“, заяви Дженсън Хуанг, основател и главен изпълнителен директор на NVIDIA. „Заедно с нашите NCP партньори изграждаме AI фабрика в планетарен мащаб.“
Платформата се интегрира със софтуерния стек на NVIDIA, включително NIM и NeMo микросервизи, Blueprints и Cloud Functions, за да ускори разработката и внедряването на AI приложения. Освен това предоставя софтуер за управление на облачните доставчици с диагностика на състоянието на GPU в реално време и автоматизиран анализ на причините за проблеми.
Освен че свързва ресурси, DGX Cloud Lepton предлага унифицирано изживяване през целия процес – от разработка, през обучение, до инференция. Разработчиците могат да закупуват GPU капацитет директно от участващите доставчици или да използват собствени изчислителни клъстери, което позволява внедряване в мултиоблачна и хибридна среда с минимални оперативни затруднения.