U značajnom potezu za rješavanje rastuće nestašice GPU-ova koja pogađa razvoj umjetne inteligencije, NVIDIA je 19. svibnja na sajmu Computex 2025 u Tajvanu najavila DGX Cloud Lepton. Platforma stvara objedinjeno tržište koje povezuje AI developere s GPU resursima brojnih cloud pružatelja diljem svijeta.
Vrijeme lansiranja je ključno jer je potražnja za GPU-ovima za treniranje i implementaciju AI-ja dosegnula neviđene razine. Prema Gartnerovom analitičaru Chiragu Dekateu, "Ne samo NVIDIA, već i cijeli NVIDIA-in opskrbni lanac jedva prati potražnju, a potražnja daleko nadmašuje ponudu." DGX Cloud Lepton ima za cilj riješiti ovu usko grlo agregiranjem GPU resursa različitih pružatelja.
Deset NVIDIA Cloud Partnera (NCP), uključujući CoreWeave, Crusoe, Lambda i SoftBank, ponudit će NVIDIA Blackwell i druge arhitekture GPU-ova putem ovog tržišta. Developeri mogu pristupiti računalnim kapacitetima u određenim regijama za potrebe na zahtjev i dugoročne potrebe, podržavajući strateške i suverene AI operativne zahtjeve.
"NVIDIA DGX Cloud Lepton povezuje našu mrežu globalnih pružatelja GPU cloud usluga s AI developerima," izjavio je Jensen Huang, osnivač i izvršni direktor NVIDIA-e. "Zajedno s našim NCP-ovima gradimo AI tvornicu planetarne razine."
Platforma se integrira s NVIDIA-inim softverskim paketom, uključujući NIM i NeMo mikroservise, Blueprints i Cloud Functions, kako bi ubrzala razvoj i implementaciju AI aplikacija. Također pruža softver za upravljanje cloud pružateljima s dijagnostikom zdravlja GPU-ova u stvarnom vremenu i automatiziranom analizom uzroka problema.
Osim što povezuje resurse, DGX Cloud Lepton nudi objedinjeno iskustvo kroz razvojne, trenažne i inferencijske AI radne tokove. Developeri mogu kupovati GPU kapacitete izravno od uključenih pružatelja ili koristiti vlastite računalne klastere, omogućujući implementaciju u multi-cloud i hibridnim okruženjima uz minimalan operativni teret.