Важным шагом к решению растущего дефицита GPU, сдерживающего развитие искусственного интеллекта, стала презентация NVIDIA DGX Cloud Lepton на выставке Computex 2025 в Тайване 19 мая. Новая платформа создает единый маркетплейс, связывающий разработчиков ИИ с GPU-ресурсами от различных облачных провайдеров по всему миру.
Момент запуска выбран не случайно: спрос на GPU для обучения и внедрения ИИ достиг беспрецедентных высот. По словам аналитика Gartner Чирага Декате, «Не только NVIDIA, но и вся цепочка поставок NVIDIA едва справляется с растущим спросом, который значительно превышает предложение». DGX Cloud Lepton призвана устранить этот узкий ресурс, агрегируя GPU от разных поставщиков.
Десять облачных партнеров NVIDIA (NCP), включая CoreWeave, Crusoe, Lambda и SoftBank, предоставят через маркетплейс GPU архитектуры NVIDIA Blackwell и других поколений. Разработчики смогут получать вычислительные мощности в нужных регионах как по требованию, так и на длительный срок, что поддерживает стратегические и суверенные задачи эксплуатации ИИ.
«NVIDIA DGX Cloud Lepton объединяет нашу сеть глобальных облачных провайдеров GPU с разработчиками ИИ», — отметил Дженсен Хуанг, основатель и генеральный директор NVIDIA. — «Вместе с нашими NCP мы строим фабрику ИИ планетарного масштаба».
Платформа интегрируется с программным стеком NVIDIA, включая микросервисы NIM и NeMo, Blueprints и Cloud Functions, ускоряя разработку и внедрение ИИ-приложений. Для облачных провайдеров предусмотрено управляющее ПО с функциями мониторинга состояния GPU в реальном времени и автоматизированного анализа причин сбоев.
Помимо простой агрегации ресурсов, DGX Cloud Lepton обеспечивает единый опыт для всех этапов работы с ИИ: разработки, обучения и инференса. Разработчики могут приобретать GPU-ресурсы напрямую у участвующих провайдеров или использовать собственные вычислительные кластеры, что позволяет развертывать решения в мультиоблачных и гибридных средах с минимальными операционными затратами.