menu
close

NVIDIA predstavuje Blackwell Ultra s cieľom ovládnuť trh AI inferencie

NVIDIA plánuje v druhej polovici roka 2025 uviesť na trh svoju novú generáciu AI čipov Blackwell Ultra, špeciálne navrhnutých na excelentný výkon v oblasti AI inferencie, kde konkurenti ako Amazon, AMD a Broadcom získavajú čoraz väčší podiel. Nové čipy sľubujú až 1,5-násobne vyšší AI výpočtový výkon v porovnaní so súčasnými GPU Blackwell a výrazne rozšírenú kapacitu pamäte. Tento strategický krok by mohol pomôcť spoločnosti NVIDIA udržať si dominantné postavenie na rýchlo rastúcom trhu AI inferencie, ktorý by mal v budúcnosti objemom výrazne prevýšiť trh AI tréningu.
NVIDIA predstavuje Blackwell Ultra s cieľom ovládnuť trh AI inferencie

NVIDIA sa pripravuje posilniť svoju pozíciu na trhu AI čipov uvedením architektúry Blackwell Ultra, ktorá predstavuje významný upgrade platformy Blackwell oznámenej začiatkom tohto roka.

Kým NVIDIA dlhodobo dominuje v oblasti AI tréningu, v segmente inferencie – kde sú AI modely nasadzované na generovanie odpovedí namiesto samotného tréningu – čelí rastúcej konkurencii. S rastúcou komplexnosťou a rozšírením AI aplikácií odborníci predpovedajú, že trh inferencie v najbližších rokoch dramaticky porastie a priláka ďalších konkurentov, ktorí budú chcieť ohroziť dominantné postavenie NVIDIA. Na rozdiel od AI tréningu, ktorý vyžaduje obrovský výpočtový výkon v celých dátových centrách, inferenčné úlohy sú rozmanitejšie a môžu ich obsluhovať rôzne špecializované hardvérové riešenia.

Produkty založené na Blackwell Ultra by mali byť dostupné od partnerov v druhej polovici roka 2025. Medzi prvými, ktorí ponúknu inštancie poháňané Blackwell Ultra, budú hlavní poskytovatelia cloudových služieb ako Amazon Web Services, Google Cloud, Microsoft Azure a Oracle Cloud Infrastructure. Nasledovať budú výrobcovia serverov ako Dell, HPE, Lenovo a Supermicro so svojimi vlastnými implementáciami.

Nová architektúra využíva druhú generáciu Transformer Engine s vlastnou technológiou Blackwell Tensor Core, v kombinácii s inováciami TensorRT-LLM a NeMo Framework na urýchlenie inferencie aj tréningu veľkých jazykových modelov. Blackwell Ultra Tensor Cores poskytujú dvojnásobné zrýchlenie attention vrstvy a 1,5-násobne vyšší AI výpočtový výkon (FLOPS) v porovnaní so štandardnými GPU Blackwell.

Podľa NVIDIA rodina Blackwell Ultra ponúka až 15 petaFLOPS hustého 4-bitového floating-point výkonu a až 288 GB HBM3e pamäte na čip. To je obzvlášť významné pre AI inferenciu, ktorá je primárne viazaná na pamäť – čím viac pamäte je k dispozícii, tým väčší model je možné obslúžiť. Ian Buck, viceprezident NVIDIA pre hyperscale a HPC, tvrdí, že Blackwell Ultra umožní obsluhovať modely pre reasoning s 10-násobným priepustnosťou oproti predchádzajúcej generácii Hopper, pričom čas odozvy sa skráti z viac ako minúty na približne desať sekúnd.

NVIDIA čelí rastúcej konkurencii zo strany AMD, ktorá nedávno uviedla svoju sériu MI300 pre AI úlohy a získala zákazníkov hľadajúcich alternatívy v čase obmedzenej dostupnosti NVIDIA čipov. V roku 2025 AMD oznámila akvizíciu AI hardvérových a softvérových inžinierov zo spoločnosti Untether AI na posilnenie svojich inferenčných schopností. Amazon taktiež prejavuje ambície ovládnuť celú AI infraštruktúru vlastnými čipmi Graviton4 a Trainium v rámci projektu Rainier, pričom úspešne trénuje veľké AI modely ako Claude 4 na ne-NVIDIA hardvéri.

Napriek týmto výzvam analytici predpovedajú, že tržby NVIDIA z dátových centier v roku 2025 vzrastú na 200 miliárd dolárov, pričom si spoločnosť udrží približne 80-85 % podiel na trhu v krátkodobom horizonte. Stratégia spoločnosti s Blackwell Ultra je zameraná na upevnenie pozície v segmente inferencie pri pokračujúcej inovácii v oblasti tréningu, čo môže zmeniť doterajšiu predstavu, že špičkové AI modely musia byť závislé výlučne od hardvéru NVIDIA.

Source: Technologyreview

Latest News