为应对困扰AI开发领域的GPU短缺问题,英伟达于2025年5月19日在台湾举办的Computex大会上宣布推出DGX Cloud Lepton平台。该平台打造了一个统一的市场,将全球多家云服务商的GPU资源与AI开发者对接。
当前GPU用于AI训练和部署的需求已达到前所未有的高度。Gartner分析师Chirag Dekate表示:“不仅仅是英伟达,整个英伟达供应链都难以满足如此巨大的需求,需求量远超供应能力。”DGX Cloud Lepton通过整合多方供应商的GPU资源,旨在打破这一瓶颈。
包括CoreWeave、Crusoe、Lambda和软银在内的十家英伟达云合作伙伴(NCPs)将通过该市场平台提供基于Blackwell及其他架构的GPU。开发者可按需或长期租用特定区域的算力资源,满足战略性和主权AI运营需求。
英伟达创始人兼首席执行官黄仁勋表示:“DGX Cloud Lepton将我们全球GPU云服务商网络与AI开发者紧密相连。与我们的NCPs合作,我们正在建设一个行星级的AI工厂。”
该平台与英伟达的软件堆栈深度集成,包括NIM和NeMo微服务、Blueprints及Cloud Functions,加速AI应用的开发与部署。同时,平台还为云服务商提供管理软件,具备实时GPU健康诊断和自动化根因分析能力。
DGX Cloud Lepton不仅仅是资源对接,更为开发、训练和推理等全流程提供统一体验。开发者可直接从参与平台的服务商购买GPU算力,或接入自有计算集群,实现多云及混合环境下的灵活部署,极大降低了运维负担。