Într-o mișcare semnificativă pentru a aborda criza tot mai mare de GPU-uri care afectează dezvoltarea AI, NVIDIA a anunțat DGX Cloud Lepton la Computex 2025, în Taiwan, pe 19 mai. Platforma creează o piață unificată ce conectează dezvoltatorii AI cu resurse GPU provenite de la mai mulți furnizori de cloud din întreaga lume.
Momentul este crucial, deoarece cererea de GPU-uri pentru antrenarea și implementarea AI a atins niveluri fără precedent. Potrivit analistului Gartner Chirag Dekate, „Nu doar NVIDIA, ci întregul lanț de aprovizionare NVIDIA abia face față cererii, iar cererea depășește cu mult oferta.” DGX Cloud Lepton își propune să rezolve acest blocaj prin agregarea resurselor GPU de la diverși furnizori.
Zece parteneri NVIDIA Cloud (NCP), inclusiv CoreWeave, Crusoe, Lambda și SoftBank, vor oferi GPU-uri NVIDIA Blackwell și alte arhitecturi prin intermediul acestei piețe. Dezvoltatorii pot accesa capacitate de calcul în regiuni specifice, atât pentru nevoi la cerere, cât și pe termen lung, susținând cerințe strategice și suverane de operare AI.
„NVIDIA DGX Cloud Lepton conectează rețeaua noastră globală de furnizori de cloud GPU cu dezvoltatorii AI”, a declarat Jensen Huang, fondator și CEO NVIDIA. „Împreună cu partenerii noștri NCP, construim o fabrică AI la scară planetară.”
Platforma se integrează cu suita software NVIDIA, inclusiv microserviciile NIM și NeMo, Blueprints și Cloud Functions, pentru a accelera dezvoltarea și implementarea aplicațiilor AI. De asemenea, oferă software de management pentru furnizorii de cloud, cu diagnosticare în timp real a stării GPU-urilor și analiză automată a cauzelor problemelor.
Dincolo de simpla conectare a resurselor, DGX Cloud Lepton oferă o experiență unificată pe tot parcursul fluxurilor de dezvoltare, antrenare și inferență. Dezvoltatorii pot achiziționa direct capacitate GPU de la furnizorii participanți sau pot aduce propriile clustere de calcul, permițând implementarea în medii multi-cloud și hibride cu un efort operațional minim.