Dalam langkah penting untuk menangani kekurangan GPU yang semakin meruncing dalam pembangunan AI, NVIDIA telah mengumumkan DGX Cloud Lepton di Computex 2025 di Taiwan pada 19 Mei. Platform ini mewujudkan pasaran bersatu yang menghubungkan pembangun AI dengan sumber GPU daripada pelbagai penyedia awan di seluruh dunia.
Masa pelancaran ini amat penting kerana permintaan GPU untuk latihan dan pelaksanaan AI telah mencapai tahap yang belum pernah berlaku sebelum ini. Menurut penganalisis Gartner, Chirag Dekate, "Bukan sahaja NVIDIA, malah rantaian bekalan NVIDIA sendiri hampir tidak dapat memenuhi permintaan, dan permintaan jauh melebihi bekalan." DGX Cloud Lepton bertujuan menyelesaikan masalah ini dengan mengumpulkan sumber GPU daripada pelbagai penyedia.
Sepuluh Rakan Awan NVIDIA (NCP) termasuk CoreWeave, Crusoe, Lambda, dan SoftBank akan menawarkan GPU NVIDIA Blackwell dan seni bina lain melalui pasaran ini. Pembangun boleh mengakses kapasiti pengkomputeran di rantau tertentu untuk keperluan atas permintaan mahupun jangka panjang, menyokong keperluan operasi AI strategik dan berdaulat.
"NVIDIA DGX Cloud Lepton menghubungkan rangkaian penyedia awan GPU global kami dengan pembangun AI," kata Jensen Huang, pengasas dan Ketua Pegawai Eksekutif NVIDIA. "Bersama-sama NCP kami, kami sedang membina kilang AI berskala planet."
Platform ini diintegrasikan dengan set perisian NVIDIA, termasuk NIM dan perkhidmatan mikro NeMo, Blueprints, dan Cloud Functions, untuk mempercepatkan pembangunan dan pelaksanaan aplikasi AI. Ia juga menyediakan perisian pengurusan untuk penyedia awan dengan diagnostik kesihatan GPU masa nyata dan analisis punca masalah secara automatik.
Lebih daripada sekadar menghubungkan sumber, DGX Cloud Lepton menawarkan pengalaman bersatu merentasi aliran kerja pembangunan, latihan, dan inferens. Pembangun boleh membeli kapasiti GPU secara langsung daripada penyedia yang mengambil bahagian atau membawa kluster pengkomputeran sendiri, membolehkan pelaksanaan merentas persekitaran multi-awan dan hibrid dengan beban operasi yang minimum.