Penyedia perkhidmatan awan utama sedang mempercepat strategi cip AI tersuai mereka, sekali gus mengubah landskap persaingan infrastruktur AI.
Sebagai syarikat dengan kadar penggunaan cip dalaman yang agak tinggi, Google telah memulakan pengeluaran besar-besaran cip TPU v6e yang memfokuskan inferens AI, yang telah menjadi arus perdana pada separuh pertama 2025. TrendForce menyoroti bahawa pertumbuhan pelayan Google didorong terutamanya oleh projek awan berdaulat dan kapasiti pusat data baharu di Asia Tenggara. TPU v6e, juga dikenali sebagai Trillium, mewakili kemajuan besar dalam portfolio perkakasan AI Google, dengan peningkatan prestasi pengiraan puncak sebanyak 4.7x setiap cip berbanding TPU v5e, serta kapasiti dan jalur lebar High Bandwidth Memory (HBM) yang digandakan.
Amazon Web Services (AWS) pula memberi tumpuan kepada penskalaan platform Trainium v2 dalaman sambil membangunkan beberapa varian Trainium v3, yang dijadualkan untuk pengeluaran besar-besaran pada 2026. AWS dijangka mendahului semua CSP AS dalam penghantaran cip AI dalaman tahun ini, menggandakan jumlah tahun 2024. Cip AWS Trainium2 menawarkan sehingga 4x prestasi berbanding Trainium generasi pertama, dengan instans Amazon EC2 Trn2 berasaskan Trainium2 dibina khusus untuk AI generatif dan dioptimumkan untuk latihan serta penggunaan model dengan ratusan bilion hingga trilion parameter.
Oracle, berbanding CSP utama lain, lebih menumpukan kepada pembelian pelayan AI dan pelayan pangkalan data dalam memori (IMDB). Pada 2025, Oracle merancang untuk meningkatkan penyebaran infrastruktur pelayan AI dan mengintegrasikan perkhidmatan pangkalan data awan terasnya dengan aplikasi AI. Pengasas bersama Oracle, Larry Ellison, telah menyoroti kedudukan unik syarikat itu kerana jumlah data perusahaan yang besar disimpan dalam pangkalan datanya. Versi terbaharu pangkalan data mereka, Oracle 23ai, direka khusus untuk keperluan beban kerja AI dan merupakan "satu-satunya pangkalan data yang boleh menjadikan semua data pelanggan tersedia serta-merta kepada semua model AI popular sambil mengekalkan privasi pelanggan sepenuhnya."
Trend ke arah cip AI tersuai ini mewakili perubahan strategik bagi penyedia awan yang ingin mengoptimumkan prestasi sambil mengurangkan kos dan kebergantungan kepada vendor pihak ketiga. Akselerator tersuai seperti AWS Trainium dan Google TPU ini bersaing secara langsung dengan GPU NVIDIA A100/H100 tetapi membezakan diri melalui integrasi awan yang lancar, harga yang boleh dijangka, dan infrastruktur yang dioptimumkan.
Menurut analisis terkini TrendForce, CSP utama Amerika Utara kekal sebagai pemacu utama pertumbuhan pasaran pelayan AI, dengan permintaan stabil turut disokong oleh pusat data tier-2 dan projek awan berdaulat di Timur Tengah dan Eropah. Walaupun ketegangan geopolitik dan sekatan eksport AS memberi kesan kepada pasaran China, penghantaran pelayan AI global dijangka meningkat 24.3% tahun ke tahun. Pertumbuhan kukuh ini menegaskan bagaimana AI menjadi teras kepada penawaran perkhidmatan awan dan mendorong pelaburan infrastruktur yang signifikan di seluruh industri.