V dôležitom kroku na riešenie rastúceho nedostatku GPU, ktorý brzdí vývoj umelej inteligencie, NVIDIA oznámila na Computex 2025 v Taiwane 19. mája spustenie platformy DGX Cloud Lepton. Platforma vytvára jednotný trh, ktorý prepája AI vývojárov so zdrojmi GPU od viacerých cloudových poskytovateľov po celom svete.
Načasovanie je kľúčové, keďže dopyt po GPU pre trénovanie a nasadzovanie AI dosiahol bezprecedentnú úroveň. Podľa analytika spoločnosti Gartner, Chiraga Dekateho, „nielen NVIDIA, ale aj jej dodávateľský reťazec sotva drží krok s dopytom, ktorý ďaleko prevyšuje ponuku.“ DGX Cloud Lepton má tento úzky profil vyriešiť agregáciou GPU zdrojov od rôznych poskytovateľov.
Desať NVIDIA Cloud Partnerov (NCP), vrátane CoreWeave, Crusoe, Lambda a SoftBank, bude cez tento trh ponúkať GPU architektúr NVIDIA Blackwell a ďalších. Vývojári budú mať prístup k výpočtovej kapacite v konkrétnych regiónoch pre okamžité aj dlhodobé potreby, čo podporuje strategické a suverénne AI prevádzkové požiadavky.
„NVIDIA DGX Cloud Lepton prepája našu sieť globálnych cloudových poskytovateľov GPU s AI vývojármi,“ povedal Jensen Huang, zakladateľ a generálny riaditeľ spoločnosti NVIDIA. „Spolu s našimi NCP budujeme AI továreň planetárneho rozsahu.“
Platforma sa integruje so softvérovým stackom NVIDIA, vrátane NIM a NeMo mikroslužieb, Blueprints a Cloud Functions, aby urýchlila vývoj a nasadzovanie AI aplikácií. Cloudovým poskytovateľom zároveň ponúka softvér na správu s diagnostikou stavu GPU v reálnom čase a automatizovanou analýzou príčin porúch.
DGX Cloud Lepton ponúka jednotný zážitok naprieč vývojom, trénovaním aj inferenciou AI. Vývojári si môžu zakúpiť GPU kapacitu priamo od zapojených poskytovateľov alebo využiť vlastné výpočtové klastre, čo umožňuje nasadenie v multi-cloudových a hybridných prostrediach s minimálnou prevádzkovou záťažou.