Em um movimento significativo para enfrentar a crescente escassez de GPUs que afeta o desenvolvimento de IA, a NVIDIA anunciou o DGX Cloud Lepton na Computex 2025, em Taiwan, no dia 19 de maio. A plataforma cria um marketplace unificado que conecta desenvolvedores de IA a recursos de GPU de diversos provedores de nuvem ao redor do mundo.
O momento é crucial, já que a demanda por GPUs para treinamento e implantação de IA atingiu níveis sem precedentes. Segundo o analista da Gartner, Chirag Dekate, "Não só a NVIDIA, mas toda a cadeia de suprimentos da NVIDIA mal consegue acompanhar a demanda, que supera em muito a oferta." O DGX Cloud Lepton busca solucionar esse gargalo ao agregar recursos de GPU de vários provedores.
Dez Parceiros de Nuvem NVIDIA (NCPs), incluindo CoreWeave, Crusoe, Lambda e SoftBank, oferecerão GPUs da arquitetura Blackwell e outras através do marketplace. Desenvolvedores poderão acessar capacidade computacional em regiões específicas tanto para demandas sob demanda quanto de longo prazo, atendendo requisitos estratégicos e de soberania operacional em IA.
"O NVIDIA DGX Cloud Lepton conecta nossa rede global de provedores de nuvem de GPU a desenvolvedores de IA", afirmou Jensen Huang, fundador e CEO da NVIDIA. "Junto com nossos NCPs, estamos construindo uma fábrica de IA em escala planetária."
A plataforma integra-se ao stack de software da NVIDIA, incluindo microserviços NIM e NeMo, Blueprints e Cloud Functions, para acelerar o desenvolvimento e a implantação de aplicações de IA. Também oferece software de gerenciamento para provedores de nuvem, com diagnósticos em tempo real da saúde das GPUs e análise automatizada de causa raiz.
Além de apenas conectar recursos, o DGX Cloud Lepton proporciona uma experiência unificada em fluxos de trabalho de desenvolvimento, treinamento e inferência. Desenvolvedores podem adquirir capacidade de GPU diretamente dos provedores participantes ou utilizar seus próprios clusters de computação, possibilitando implantação em ambientes multi-cloud e híbridos com o mínimo de complexidade operacional.