AI 개발 분야를 괴롭히는 GPU 부족 문제를 해결하기 위해, NVIDIA는 2025년 5월 19일 대만에서 열린 컴퓨텍스(Computex)에서 'DGX Cloud Lepton'을 발표했다. 이 플랫폼은 전 세계 여러 클라우드 제공업체의 GPU 자원을 AI 개발자와 연결하는 통합 마켓플레이스를 구축한다.
이번 발표는 AI 학습 및 배포를 위한 GPU 수요가 사상 최고치를 기록하는 시점에 이뤄졌다. 가트너(Gartner) 분석가 치라그 데카테(Chirag Dekate)는 "NVIDIA뿐만 아니라 NVIDIA의 공급망 전체가 수요를 따라잡기 힘들 정도로, 수요가 공급을 훨씬 초과하고 있다"고 평가했다. DGX Cloud Lepton은 다양한 제공업체의 GPU 자원을 집약해 이러한 병목 현상을 해소하는 것을 목표로 한다.
CoreWeave, Crusoe, Lambda, SoftBank 등 10곳의 NVIDIA 클라우드 파트너(NCP)가 이번 마켓플레이스를 통해 NVIDIA Blackwell 및 기타 아키텍처의 GPU를 제공한다. 개발자들은 특정 지역에서 필요에 따라 온디맨드 또는 장기적으로 컴퓨팅 자원을 확보할 수 있어, 전략적이거나 주권적 AI 운영 요구에도 대응할 수 있다.
NVIDIA의 창립자 겸 CEO 젠슨 황(Jensen Huang)은 "NVIDIA DGX Cloud Lepton은 전 세계 GPU 클라우드 제공업체 네트워크와 AI 개발자를 연결한다"며, "NCP들과 함께 우리는 행성 규모의 AI 팩토리를 구축하고 있다"고 밝혔다.
이 플랫폼은 NIM, NeMo 마이크로서비스, 블루프린트, 클라우드 펑션 등 NVIDIA의 소프트웨어 스택과 통합되어 AI 애플리케이션 개발 및 배포를 가속화한다. 또한 클라우드 제공업체를 위한 관리 소프트웨어도 제공해, 실시간 GPU 상태 진단과 자동화된 근본 원인 분석 기능을 지원한다.
DGX Cloud Lepton은 단순히 리소스를 연결하는 데 그치지 않고, 개발, 학습, 추론 워크플로우 전반에 걸쳐 통합된 경험을 제공한다. 개발자들은 참여 제공업체로부터 직접 GPU 용량을 구매하거나, 자체 컴퓨팅 클러스터를 가져와 멀티클라우드 및 하이브리드 환경에서도 최소한의 운영 부담으로 배포할 수 있다.