menu
close

Pilvijätit kiihdyttävät räätälöityjen tekoälypiirien käyttöönottoa

Google on aloittanut tekoälyinfran massiivisen käyttöönoton omilla TPU v6e -piireillään, joista on tullut valtavirtaa vuoden 2025 ensimmäisellä puoliskolla. Samaan aikaan AWS keskittyy Trainium v2 -alustan skaalaamiseen ja kehittää useita Trainium v3 -variantteja vuodelle 2026, ja AWS:n odotetaan johtavan yhdysvaltalaisten pilvipalveluntarjoajien omien tekoälypiirien toimituksissa tänä vuonna. Tämä kehitys merkitsee merkittävää muutosta, kun suuret pilvipalveluyritykset kehittävät ja ottavat yhä enemmän käyttöön omia tekoälykiihdyttimiään kolmansien osapuolien ratkaisujen sijaan.
Pilvijätit kiihdyttävät räätälöityjen tekoälypiirien käyttöönottoa

Suurimmat pilvipalveluntarjoajat etenevät nopeasti omien tekoälypiiristrategioidensa kanssa, mikä muokkaa tekoälyinfrastruktuurin kilpailukenttää.

Yrityksenä, jolla on suhteellisen korkea omakehitteisten piirien käyttöönottoaste, Google on aloittanut tekoälyinfran massiivisen käyttöönoton TPU v6e -piireillään, joista on tullut valtavirtaa vuoden 2025 ensimmäisellä puoliskolla. TrendForce korostaa, että Googlen palvelinkasvua ovat vauhdittaneet erityisesti suvereenit pilvihankkeet ja uudet datakeskukset Kaakkois-Aasiassa. TPU v6e, joka tunnetaan myös nimellä Trillium, edustaa merkittävää edistysaskelta Googlen tekoälylaitteistojen valikoimassa, tarjoten jopa 4,7-kertaisen huipputehon per piiri verrattuna TPU v5e:hen sekä kaksinkertaisen High Bandwidth Memory (HBM) -kapasiteetin ja -kaistanleveyden.

Amazon Web Services (AWS) keskittyy omakehitteisen Trainium v2 -alustan skaalaamiseen ja kehittää useita Trainium v3 -variantteja, joiden massatuotanto on suunniteltu vuodelle 2026. AWS:n odotetaan johtavan kaikkia yhdysvaltalaisia pilvipalveluntarjoajia omien tekoälypiirien toimituksissa tänä vuonna, tuplaten vuoden 2024 määrät. AWS Trainium2 -piiri tarjoaa jopa nelinkertaisen suorituskyvyn ensimmäisen sukupolven Trainiumiin verrattuna, ja Trainium2-pohjaiset Amazon EC2 Trn2 -instanssit on suunniteltu erityisesti generatiivista tekoälyä varten ja optimoitu mallien koulutukseen ja käyttöönottoon, joiden parametrit lasketaan sadoissa miljardeissa tai jopa biljoonissa.

Oracle keskittyy muihin suuriin pilvipalveluntarjoajiin verrattuna enemmän tekoälypalvelimien ja in-memory-tietokantapalvelimien (IMDB) hankintaan. Vuonna 2025 Oracle aikoo tehostaa tekoälypalvelininfrastruktuurin käyttöönottoa ja integroida ydintietokantapalvelunsa tekoälysovelluksiin. Oraclen perustaja Larry Ellison on korostanut yhtiön ainutlaatuista asemaa, sillä sen tietokannoissa on valtavat määrät yritysdataa. Yhtiön uusin tietokantaversio, Oracle 23ai, on räätälöity erityisesti tekoälykuormien tarpeisiin ja on "ainoa tietokanta, joka voi tehdä kaiken asiakasdatan välittömästi saataville kaikille suosituimmille tekoälymalleille samalla, kun asiakasdatan yksityisyys säilyy täysin".

Räätälöityihin tekoälypiireihin siirtyminen on strateginen muutos pilvipalveluntarjoajille, jotka tavoittelevat suorituskyvyn optimointia sekä kustannusten ja kolmansista osapuolista riippuvuuden vähentämistä. Nämä omat kiihdyttimet, kuten AWS Trainium ja Googlen TPU:t, kilpailevat suoraan NVIDIA:n A100/H100 GPU-piirien kanssa, mutta erottuvat saumattomalla pilvi-integraatiolla, ennakoitavalla hinnoittelulla ja optimoidulla infrastruktuurilla.

TrendForcen tuoreimman analyysin mukaan pohjoisamerikkalaiset pilvipalveluntarjoajat ovat edelleen tekoälypalvelinmarkkinoiden kasvun tärkeimmät veturit, ja vakaata kysyntää tukevat myös toisen tason datakeskukset sekä suvereenit pilvihankkeet Lähi-idässä ja Euroopassa. Vaikka geopoliittiset jännitteet ja Yhdysvaltojen vientirajoitukset vaikuttavat Kiinan markkinoihin, maailmanlaajuisten tekoälypalvelinten toimitusten ennustetaan kasvavan 24,3 % vuoden takaiseen verrattuna. Tämä vahva kasvu korostaa, kuinka tekoäly on nousemassa pilvipalveluiden ytimeen ja vauhdittaa merkittäviä infrastruktuuri-investointeja koko toimialalla.

Source:

Latest News