menu
close

OpenAI Uji TPU Google untuk Tangani Kenaikan Kos Inferens AI

OpenAI telah mula menguji Tensor Processing Units (TPU) milik Google sebagai alternatif untuk menguruskan kos inferens AI yang semakin meningkat, yang kini melebihi 50% daripada bajet pengiraan syarikat itu. Walaupun tidak menandakan pelaksanaan berskala besar dalam masa terdekat, langkah strategik ini merupakan penggunaan bermakna pertama OpenAI terhadap perkakasan selain NVIDIA dan menunjukkan perubahan daripada kebergantungan eksklusif kepada infrastruktur Microsoft. Eksplorasi ini berpotensi mengubah landskap perkakasan AI dengan mencabar dominasi NVIDIA dan mewujudkan dinamik persaingan baharu antara penyedia teknologi utama.
OpenAI Uji TPU Google untuk Tangani Kenaikan Kos Inferens AI

OpenAI, salah satu pelanggan terbesar di dunia bagi unit pemprosesan grafik (GPU) NVIDIA, telah mula menguji Tensor Processing Units (TPU) Google untuk menggerakkan sistem AI mereka, termasuk ChatGPT. Langkah ini diambil apabila syarikat berdepan peningkatan kos pengiraan dan mencari penyelesaian yang lebih menjimatkan untuk operasi AI yang semakin berkembang.

Menurut penganalisis industri, inferens—proses di mana model AI menggunakan pengetahuan terlatih untuk membuat ramalan atau keputusan—kini mengambil lebih 50% daripada bajet pengiraan OpenAI. TPU, terutamanya generasi lama, menawarkan kos per inferens yang jauh lebih rendah berbanding GPU NVIDIA, menjadikannya alternatif menarik walaupun mungkin tidak setanding prestasi puncak cip NVIDIA terkini.

"Walaupun TPU lama tidak menyamai prestasi puncak cip Nvidia terkini, seni bina khususnya meminimumkan pembaziran tenaga dan sumber menganggur, menjadikannya lebih menjimatkan pada skala besar," jelas Charlie Dai, Naib Presiden dan penganalisis utama di Forrester. Analisis industri menunjukkan Google mungkin memperoleh kuasa pengiraan AI pada kira-kira 20% daripada kos yang ditanggung oleh pembeli GPU NVIDIA berprestasi tinggi, memberikan kelebihan kecekapan kos sebanyak 4-6 kali ganda.

Namun begitu, OpenAI menjelaskan bahawa mereka tiada rancangan segera untuk pelaksanaan TPU secara besar-besaran. Jurucakap syarikat memberitahu Reuters bahawa mereka sedang "menguji awal dengan beberapa TPU Google" tetapi pada masa ini "tiada rancangan untuk melaksanakannya pada skala besar." Pendekatan berhati-hati ini mencerminkan cabaran teknikal besar dalam peralihan infrastruktur, memandangkan perisian OpenAI telah dioptimumkan terutamanya untuk GPU.

Selain pertimbangan kos, langkah ini juga menandakan kepelbagaian strategik sumber pengiraan OpenAI di luar Microsoft, yang sebelum ini menjadi penyedia infrastruktur pusat data eksklusif sehingga Januari 2025. Syarikat itu telah bekerjasama dengan Oracle dan CoreWeave dalam program infrastruktur Stargate dan sedang membangunkan pemproses AI tersuai sendiri yang dijangka mencapai peringkat tape-out akhir tahun ini.

Implikasi terhadap pasaran perkakasan AI boleh menjadi signifikan. Jika berjaya, penggunaan TPU oleh OpenAI boleh mengesahkan perkakasan Google sebagai alternatif yang berdaya saing kepada monopoli hampir NVIDIA dalam pengkomputeran AI berprestasi tinggi. Ini boleh memberi tekanan kepada NVIDIA untuk berinovasi atau menyesuaikan harga, sambil mewujudkan dinamik persaingan baharu antara penyedia awan seperti Google, Microsoft, dan Amazon yang bersaing untuk menguasai infrastruktur AI.

Source: Computerworld

Latest News