主要云服务提供商正加速推进自研AI芯片战略,重塑AI基础设施的竞争格局。
作为自研芯片采用率较高的公司,Google已开始大规模部署其面向AI推理的TPU v6e芯片,该芯片将在2025年上半年成为主流。 TrendForce指出,Google服务器的增长主要受主权云项目和东南亚新建数据中心容量的推动。 TPU v6e(又称Trillium)标志着Google AI硬件产品线的重大进步,其单芯片峰值算力相比TPU v5e提升4.7倍,高带宽内存(HBM)容量和带宽均实现翻倍。
亚马逊云服务(AWS)正专注于扩展自研的Trainium v2平台,同时开发多款Trainium v3变体,计划于2026年量产。预计AWS今年将在美国所有云服务商中自研AI芯片出货量领先,出货量将较2024年翻倍。 AWS Trainium2芯片的性能最高可达第一代Trainium的4倍,基于Trainium2的Amazon EC2 Trn2实例专为生成式AI设计,并针对拥有数百亿至万亿参数的大模型训练与部署进行了优化。
相比其他主要云服务商,Oracle更侧重于采购AI服务器和内存数据库(IMDB)服务器。2025年,Oracle计划加大AI服务器基础设施部署,并将其核心云数据库服务与AI应用集成。 Oracle联合创始人Larry Ellison强调,公司因其数据库中存储的大量企业数据而具备独特优势。其最新版本数据库Oracle 23ai专为AI工作负载定制,是“唯一能够让所有客户数据即时可用于所有主流AI模型,同时完全保护客户隐私的数据库”。
云服务商向定制AI芯片转型,旨在优化性能、降低成本并减少对第三方厂商的依赖,这一趋势已成为战略转折点。AWS Trainium和Google TPU等定制加速器正与NVIDIA的A100/H100 GPU直接竞争,但通过无缝云集成、可预测的定价和优化的基础设施实现差异化。
根据TrendForce最新分析,北美主要云服务商仍是AI服务器市场增长的核心驱动力,二线数据中心及中东、欧洲的主权云项目也在持续推动需求。尽管地缘政治紧张和美国出口管制影响了中国市场,但全球AI服务器出货量预计将同比增长24.3%。 这一强劲增长凸显了AI正成为云服务核心,并推动整个行业在基础设施上的重大投资。