Ve významném kroku k řešení rostoucího nedostatku GPU, který sužuje vývoj AI, oznámila společnost NVIDIA na veletrhu Computex 2025 v Tchaj-wanu dne 19. května spuštění platformy DGX Cloud Lepton. Tato platforma vytváří jednotné tržiště, které propojuje AI vývojáře se zdroji GPU od různých cloudových poskytovatelů po celém světě.
Načasování je klíčové, protože poptávka po GPU pro trénování a nasazení AI dosáhla bezprecedentní úrovně. Podle analytika společnosti Gartner, Chiraga Dekateho, „nejen NVIDIA, ale celý dodavatelský řetězec NVIDIA sotva drží krok s poptávkou, která výrazně převyšuje nabídku.“ DGX Cloud Lepton má za cíl tento úzký profil vyřešit agregací GPU zdrojů od různých poskytovatelů.
Deset NVIDIA Cloud Partnerů (NCP), včetně společností CoreWeave, Crusoe, Lambda a SoftBank, bude prostřednictvím tržiště nabízet GPU architektur NVIDIA Blackwell a dalších. Vývojáři získají přístup k výpočetní kapacitě ve specifických regionech jak pro okamžité, tak dlouhodobé potřeby, což podpoří strategické a suverénní provozní požadavky na AI.
„NVIDIA DGX Cloud Lepton propojuje naši síť globálních cloudových poskytovatelů GPU s AI vývojáři,“ uvedl Jensen Huang, zakladatel a generální ředitel společnosti NVIDIA. „Společně s našimi NCP budujeme AI továrnu planetárního měřítka.“
Platforma se integruje se softwarovým stackem NVIDIA, včetně mikroservis NIM a NeMo, Blueprints a Cloud Functions, aby urychlila vývoj a nasazení AI aplikací. Poskytovatelům cloudu nabízí také software pro správu s diagnostikou stavu GPU v reálném čase a automatizovanou analýzou příčin problémů.
DGX Cloud Lepton nenabízí pouze propojení zdrojů, ale poskytuje jednotné prostředí napříč vývojovými, trénovacími a inferenčními workflow. Vývojáři si mohou zakoupit kapacitu GPU přímo od zapojených poskytovatelů nebo využít vlastní výpočetní clustery, což umožňuje nasazení v multi-cloudových i hybridních prostředích s minimální provozní zátěží.