Merkittävänä liikkeenä kasvavan GPU-pulan ratkaisemiseksi tekoälykehityksessä NVIDIA julkisti DGX Cloud Leptonin Computex 2025 -tapahtumassa Taiwanissa 19. toukokuuta. Alusta luo yhtenäisen markkinapaikan, joka yhdistää tekoälykehittäjät GPU-resursseihin useilta pilvipalveluntarjoajilta ympäri maailmaa.
Ajankohta on kriittinen, sillä GPU-kysyntä tekoälyn koulutuksessa ja käyttöönotossa on ennennäkemättömän suurta. Gartnerin analyytikko Chirag Dekaten mukaan "Ei pelkästään NVIDIA, vaan myös NVIDIAn toimitusketju tuskin pysyy kysynnän perässä, ja kysyntä ylittää tarjonnan moninkertaisesti." DGX Cloud Lepton pyrkii ratkaisemaan tämän pullonkaulan kokoamalla GPU-resursseja eri tarjoajilta yhteen.
Kymmenen NVIDIA Cloud Partneria (NCP), kuten CoreWeave, Crusoe, Lambda ja SoftBank, tarjoavat NVIDIA Blackwell- ja muita arkkitehtuureja edustavia GPU-yksiköitä markkinapaikan kautta. Kehittäjät voivat hyödyntää laskentatehoa tietyillä alueilla sekä tarpeen mukaan että pitkäaikaisiin tarpeisiin, tukien strategisia ja kansallisia tekoälyn käyttötarpeita.
"NVIDIA DGX Cloud Lepton yhdistää globaalin GPU-pilvipalveluverkostomme tekoälykehittäjiin", sanoi NVIDIAn perustaja ja toimitusjohtaja Jensen Huang. "Yhdessä NCP-kumppaniemme kanssa rakennamme planetaarisen mittakaavan tekoälytehdasta."
Alusta integroituu NVIDIAn ohjelmistopinon kanssa, mukaan lukien NIM- ja NeMo-mikropalvelut, Blueprints ja Cloud Functions, nopeuttaen tekoälysovellusten kehitystä ja käyttöönottoa. Se tarjoaa myös pilvipalveluntarjoajille hallintaohjelmiston, jossa on reaaliaikainen GPU-terveystilannekuva ja automatisoitu juurisyyn analyysi.
DGX Cloud Lepton ei pelkästään yhdistä resursseja, vaan tarjoaa yhtenäisen käyttökokemuksen kehitys-, koulutus- ja inferenssivaiheisiin. Kehittäjät voivat ostaa GPU-kapasiteettia suoraan osallistuvilta tarjoajilta tai hyödyntää omia laskentaklustereitaan, mahdollistaen käyttöönoton monipilvi- ja hybridiympäristöissä minimaalisella operatiivisella kuormalla.