英伟达正准备通过即将发布的Blackwell Ultra架构,进一步巩固其在AI芯片市场的领先地位。这一架构是今年早些时候发布的Blackwell平台的重大升级。
尽管英伟达在AI训练市场占据主导地位,但在AI推理领域面临着日益激烈的竞争。在推理阶段,AI模型被部署用于生成响应,而非训练。随着AI应用变得更加复杂和普及,业内专家预测未来几年推理市场将迎来爆发式增长,吸引众多竞争者挑战英伟达的霸主地位。与需要整个数据中心强大算力的AI训练不同,推理工作负载更加多样化,可由多种专用硬件处理。
基于Blackwell Ultra的产品预计将于2025年下半年由合作伙伴陆续推出。亚马逊云服务(AWS)、谷歌云、微软Azure和甲骨文云基础设施等主要云服务商将率先提供搭载Blackwell Ultra的实例,戴尔、慧与(HPE)、联想和超微等服务器厂商也将推出相应的解决方案。
新架构采用英伟达第二代Transformer Engine,结合定制的Blackwell张量核心技术,以及TensorRT-LLM和NeMo Framework创新,加速大语言模型的推理与训练。Blackwell Ultra张量核心在注意力层加速方面实现了2倍提升,AI计算FLOPS较标准Blackwell GPU提升1.5倍。
据英伟达介绍,Blackwell Ultra系列单芯片可实现高达15 petaFLOPS的密集4位浮点性能,并配备高达288 GB的HBM3e内存。这对于以内存为主要瓶颈的AI推理尤为重要——内存越大,可服务的模型规模也越大。英伟达超大规模与高性能计算副总裁Ian Buck表示,Blackwell Ultra将使推理模型的吞吐量达到上一代Hopper的10倍,将响应时间从一分钟以上缩短至仅十秒。
英伟达正面临来自AMD的日益激烈竞争。AMD近期推出了面向AI工作负载的MI300系列,并在英伟达供应受限的情况下获得了部分客户青睐。2025年,AMD宣布收购Untether AI的AI硬件与软件工程师,以增强其推理能力。亚马逊也在通过Graviton4和Project Rainier的Trainium芯片展现掌控AI基础设施全栈的雄心,已成功在非英伟达硬件上训练出如Claude 4等主流AI模型。
尽管挑战不断,分析师预计英伟达2025年数据中心销售额将增长至2000亿美元,短期内仍将保持约80-85%的市场份额。英伟达通过Blackwell Ultra的战略,旨在稳固其在推理市场的地位,同时持续推动训练能力创新,有望改变顶级AI模型必须依赖英伟达硬件的传统认知。