NVIDIA sa pripravuje posilniť svoju pozíciu na trhu AI čipov uvedením architektúry Blackwell Ultra, ktorá predstavuje významný upgrade platformy Blackwell oznámenej začiatkom tohto roka.
Kým NVIDIA dlhodobo dominuje v oblasti AI tréningu, v segmente inferencie – kde sú AI modely nasadzované na generovanie odpovedí namiesto samotného tréningu – čelí rastúcej konkurencii. S rastúcou komplexnosťou a rozšírením AI aplikácií odborníci predpovedajú, že trh inferencie v najbližších rokoch dramaticky porastie a priláka ďalších konkurentov, ktorí budú chcieť ohroziť dominantné postavenie NVIDIA. Na rozdiel od AI tréningu, ktorý vyžaduje obrovský výpočtový výkon v celých dátových centrách, inferenčné úlohy sú rozmanitejšie a môžu ich obsluhovať rôzne špecializované hardvérové riešenia.
Produkty založené na Blackwell Ultra by mali byť dostupné od partnerov v druhej polovici roka 2025. Medzi prvými, ktorí ponúknu inštancie poháňané Blackwell Ultra, budú hlavní poskytovatelia cloudových služieb ako Amazon Web Services, Google Cloud, Microsoft Azure a Oracle Cloud Infrastructure. Nasledovať budú výrobcovia serverov ako Dell, HPE, Lenovo a Supermicro so svojimi vlastnými implementáciami.
Nová architektúra využíva druhú generáciu Transformer Engine s vlastnou technológiou Blackwell Tensor Core, v kombinácii s inováciami TensorRT-LLM a NeMo Framework na urýchlenie inferencie aj tréningu veľkých jazykových modelov. Blackwell Ultra Tensor Cores poskytujú dvojnásobné zrýchlenie attention vrstvy a 1,5-násobne vyšší AI výpočtový výkon (FLOPS) v porovnaní so štandardnými GPU Blackwell.
Podľa NVIDIA rodina Blackwell Ultra ponúka až 15 petaFLOPS hustého 4-bitového floating-point výkonu a až 288 GB HBM3e pamäte na čip. To je obzvlášť významné pre AI inferenciu, ktorá je primárne viazaná na pamäť – čím viac pamäte je k dispozícii, tým väčší model je možné obslúžiť. Ian Buck, viceprezident NVIDIA pre hyperscale a HPC, tvrdí, že Blackwell Ultra umožní obsluhovať modely pre reasoning s 10-násobným priepustnosťou oproti predchádzajúcej generácii Hopper, pričom čas odozvy sa skráti z viac ako minúty na približne desať sekúnd.
NVIDIA čelí rastúcej konkurencii zo strany AMD, ktorá nedávno uviedla svoju sériu MI300 pre AI úlohy a získala zákazníkov hľadajúcich alternatívy v čase obmedzenej dostupnosti NVIDIA čipov. V roku 2025 AMD oznámila akvizíciu AI hardvérových a softvérových inžinierov zo spoločnosti Untether AI na posilnenie svojich inferenčných schopností. Amazon taktiež prejavuje ambície ovládnuť celú AI infraštruktúru vlastnými čipmi Graviton4 a Trainium v rámci projektu Rainier, pričom úspešne trénuje veľké AI modely ako Claude 4 na ne-NVIDIA hardvéri.
Napriek týmto výzvam analytici predpovedajú, že tržby NVIDIA z dátových centier v roku 2025 vzrastú na 200 miliárd dolárov, pričom si spoločnosť udrží približne 80-85 % podiel na trhu v krátkodobom horizonte. Stratégia spoločnosti s Blackwell Ultra je zameraná na upevnenie pozície v segmente inferencie pri pokračujúcej inovácii v oblasti tréningu, čo môže zmeniť doterajšiu predstavu, že špičkové AI modely musia byť závislé výlučne od hardvéru NVIDIA.