menu
close

NVIDIA představuje Blackwell Ultra s cílem ovládnout trh AI inferencí

NVIDIA plánuje v druhé polovině roku 2025 uvést na trh novou generaci AI čipů Blackwell Ultra, které jsou speciálně navrženy pro excelentní výkon v oblasti AI inferencí, kde konkurenti jako Amazon, AMD a Broadcom rychle posilují. Nové čipy slibují až 1,5násobný nárůst výpočetního výkonu pro AI oproti současným GPU Blackwell a výrazně rozšířenou kapacitu paměti. Tento strategický krok by mohl pomoci NVIDIA udržet si dominantní postavení na rychle rostoucím trhu AI inferencí, který má v budoucnu velikostí překonat trh AI trénování.
NVIDIA představuje Blackwell Ultra s cílem ovládnout trh AI inferencí

NVIDIA se připravuje posílit svou pozici na trhu AI čipů s nadcházejícím uvedením architektury Blackwell Ultra, která představuje významný upgrade platformy Blackwell oznámené začátkem tohoto roku.

Zatímco NVIDIA dominuje trhu AI trénování, v oblasti inferencí – kde jsou AI modely nasazovány pro generování odpovědí namísto samotného učení – čelí společnost rostoucí konkurenci. S tím, jak se AI aplikace stávají složitějšími a rozšířenějšími, odborníci z oboru předpovídají, že trh inferencí v příštích letech dramaticky poroste a přiláká konkurenty, kteří chtějí zpochybnit dominanci NVIDIA. Na rozdíl od AI trénování, které vyžaduje obrovský výpočetní výkon v rámci celých datových center, jsou inference úlohy rozmanitější a lze je zvládat na různých specializovaných hardwarových řešeních.

Produkty založené na Blackwell Ultra by měly být dostupné od partnerů ve druhé polovině roku 2025. Mezi prvními, kdo nabídne instance poháněné Blackwell Ultra, budou hlavní cloudoví poskytovatelé jako Amazon Web Services, Google Cloud, Microsoft Azure a Oracle Cloud Infrastructure. Následovat budou výrobci serverů jako Dell, HPE, Lenovo a Supermicro se svými vlastními implementacemi.

Nová architektura využívá druhou generaci Transformer Engine s vlastní technologií Blackwell Tensor Core, v kombinaci s inovacemi TensorRT-LLM a NeMo Framework pro urychlení jak inferencí, tak trénování velkých jazykových modelů. Blackwell Ultra Tensor Cores poskytují 2x rychlejší akceleraci attention vrstev a 1,5x vyšší AI výpočetní výkon (FLOPS) oproti standardním GPU Blackwell.

Podle NVIDIA nabízí rodina Blackwell Ultra až 15 petaFLOPS výkonu v hustém 4bitovém floating-point režimu a až 288 GB paměti HBM3e na čip. To je obzvláště důležité pro AI inference, která je primárně limitována velikostí paměti – čím více paměti je k dispozici, tím větší model lze obsloužit. Ian Buck, viceprezident NVIDIA pro hyperscale a HPC, tvrdí, že Blackwell Ultra umožní obsluhovat reasoning modely s 10násobnou propustností oproti předchozí generaci Hopper, čímž se doba odezvy zkrátí z více než minuty na pouhých deset sekund.

NVIDIA čelí rostoucí konkurenci ze strany AMD, která nedávno uvedla na trh řadu MI300 pro AI úlohy a získává zákazníky hledající alternativy kvůli omezené dostupnosti produktů NVIDIA. V roce 2025 AMD oznámila akvizici AI hardwarových a softwarových inženýrů ze společnosti Untether AI, aby posílila své schopnosti v oblasti inferencí. Amazon rovněž projevuje ambice ovládnout celý AI infrastrukturní stack díky čipům Graviton4 a Trainium z projektu Rainier, na kterých úspěšně trénuje hlavní AI modely jako Claude 4 bez použití hardwaru NVIDIA.

Navzdory těmto výzvám analytici předpovídají, že prodeje NVIDIA v segmentu datových center v roce 2025 vzrostou na 200 miliard dolarů, přičemž si společnost v krátkodobém horizontu udrží přibližně 80–85% podíl na trhu. Strategie společnosti s Blackwell Ultra se zdá být zaměřena na upevnění pozice v oblasti inferencí při současném pokračování inovací v trénování, což by mohlo změnit dosavadní předpoklad, že špičkové AI modely musí být závislé výhradně na hardwaru NVIDIA.

Source: Technologyreview

Latest News