प्रमुख क्लाउड सेवा प्रदाता अपने कस्टम AI चिप्स की रणनीतियों को तेजी से आगे बढ़ा रहे हैं, जिससे AI इन्फ्रास्ट्रक्चर का प्रतिस्पर्धात्मक परिदृश्य बदल रहा है।
स्व-विकसित चिप्स को अपनाने की उच्च दर वाली कंपनी के रूप में, Google ने अपने AI इन्फरेंस-केंद्रित TPU v6e चिप्स का बड़े पैमाने पर वितरण शुरू कर दिया है, जो 2025 की पहली छमाही में मुख्यधारा बन गए हैं। TrendForce ने बताया कि Google के सर्वर ग्रोथ का मुख्य कारण संप्रभु क्लाउड परियोजनाएं और दक्षिण-पूर्व एशिया में नए डेटा सेंटर की क्षमता है। TPU v6e, जिसे Trillium भी कहा जाता है, Google के AI हार्डवेयर पोर्टफोलियो में एक महत्वपूर्ण प्रगति है, जो TPU v5e की तुलना में प्रति चिप 4.7 गुना अधिक पीक कंप्यूट परफॉर्मेंस, और दोगुनी हाई बैंडविड्थ मेमोरी (HBM) क्षमता व बैंडविड्थ प्रदान करता है।
Amazon Web Services (AWS) अपने इन-हाउस Trainium v2 प्लेटफ़ॉर्म को स्केल करने पर केंद्रित है, साथ ही Trainium v3 के कई वेरिएंट्स विकसित कर रहा है, जिनका 2026 में बड़े पैमाने पर उत्पादन होगा। AWS के इस साल अमेरिका के सभी CSPs में सबसे अधिक इन-हाउस AI चिप्स की शिपमेंट करने की उम्मीद है, जो 2024 की मात्रा से दोगुनी होगी। AWS Trainium2 चिप पहली पीढ़ी के Trainium की तुलना में 4 गुना अधिक प्रदर्शन देती है, और Trainium2-आधारित Amazon EC2 Trn2 इंस्टेंस खासतौर पर जनरेटिव AI के लिए बनाए गए हैं, जो सैकड़ों अरब से लेकर ट्रिलियन+ पैरामीटर्स वाले मॉडल्स के प्रशिक्षण और तैनाती के लिए अनुकूलित हैं।
Oracle, अन्य प्रमुख CSPs की तुलना में, AI सर्वर और इन-मेमोरी डेटाबेस (IMDB) सर्वर खरीदने पर अधिक केंद्रित है। 2025 में, Oracle AI सर्वर इन्फ्रास्ट्रक्चर की तैनाती को बढ़ाने और अपनी मुख्य क्लाउड डेटाबेस सेवाओं को AI एप्लिकेशंस के साथ एकीकृत करने की योजना बना रहा है। Oracle के सह-संस्थापक लैरी एलिसन ने कंपनी की अनूठी स्थिति को रेखांकित किया है, क्योंकि उसके डेटाबेस में विशाल मात्रा में एंटरप्राइज डेटा संग्रहीत है। इसके नवीनतम संस्करण Oracle 23ai को खासतौर पर AI वर्कलोड्स की जरूरतों के लिए तैयार किया गया है और यह "एकमात्र डेटाबेस है जो सभी ग्राहक डेटा को सभी लोकप्रिय AI मॉडल्स के लिए तुरंत उपलब्ध करा सकता है, साथ ही ग्राहक की गोपनीयता को पूरी तरह सुरक्षित रखता है।"
कस्टम AI चिप्स की ओर बढ़ता रुझान क्लाउड प्रदाताओं के लिए एक रणनीतिक बदलाव है, जिससे वे प्रदर्शन को अनुकूलित करते हुए लागत और तीसरे पक्ष के विक्रेताओं पर निर्भरता कम कर सकते हैं। AWS Trainium और Google के TPUs जैसे कस्टम एक्सेलरेटर सीधे NVIDIA के A100/H100 GPUs से प्रतिस्पर्धा करते हैं, लेकिन ये सहज क्लाउड इंटीग्रेशन, पूर्वानुमानित मूल्य निर्धारण और अनुकूलित इन्फ्रास्ट्रक्चर के जरिए खुद को अलग करते हैं।
TrendForce के नवीनतम विश्लेषण के अनुसार, प्रमुख उत्तर अमेरिकी CSPs AI सर्वर मार्केट ग्रोथ के मुख्य चालक बने हुए हैं, जबकि टियर-2 डेटा सेंटर्स और मध्य पूर्व व यूरोप की संप्रभु क्लाउड परियोजनाएं भी स्थिर मांग को बढ़ावा दे रही हैं। हालांकि भू-राजनीतिक तनाव और अमेरिकी निर्यात प्रतिबंधों के कारण चीनी बाजार प्रभावित हुआ है, फिर भी वैश्विक AI सर्वर शिपमेंट्स में साल-दर-साल 24.3% की वृद्धि होने का अनुमान है। यह मजबूत वृद्धि दर्शाती है कि AI अब क्लाउड सेवा पेशकशों के केंद्र में आ चुका है और पूरे उद्योग में महत्वपूर्ण इन्फ्रास्ट्रक्चर निवेश को प्रेरित कर रहा है।