menu
close

NVIDIA представя Blackwell Ultra, за да доминира на пазара за AI инференция

NVIDIA ще пусне следващото поколение AI чипове Blackwell Ultra през втората половина на 2025 г., специално създадени да превъзхождат в AI инференцията, където конкуренти като Amazon, AMD и Broadcom набират скорост. Новите чипове обещават до 1,5 пъти по-висока AI изчислителна производителност от сегашните Blackwell GPU и значително разширен капацитет на паметта. Този стратегически ход може да помогне на NVIDIA да запази доминиращата си позиция на бързо растящия пазар за AI инференция, който се очаква в крайна сметка да надмине по размер пазара за обучение.
NVIDIA представя Blackwell Ultra, за да доминира на пазара за AI инференция

NVIDIA се подготвя да засили позициите си на пазара за AI чипове с предстоящото пускане на архитектурата Blackwell Ultra — значителен ъпгрейд на платформата Blackwell, обявена по-рано тази година.

Докато NVIDIA доминираше пазара за обучение на AI модели, компанията се сблъсква с нарастваща конкуренция в сферата на инференцията, където AI моделите се използват за генериране на отговори, а не за обучение. С усложняването и разпространението на AI приложенията, експерти от индустрията прогнозират, че пазарът за инференция ще нарасне драстично през следващите години, привличайки конкуренти, които искат да оспорят доминацията на NVIDIA. За разлика от AI обучението, което изисква огромна изчислителна мощност в цели дейта центрове, инференционните натоварвания са по-разнообразни и могат да се обработват от различен специализиран хардуер.

Продуктите, базирани на Blackwell Ultra, се очаква да бъдат налични при партньорите през втората половина на 2025 г. Основни облачни доставчици като Amazon Web Services, Google Cloud, Microsoft Azure и Oracle Cloud Infrastructure ще бъдат сред първите, които ще предложат инстанции с Blackwell Ultra, а производители на сървъри като Dell, HPE, Lenovo и Supermicro ще последват със свои реализации.

Новата архитектура използва второто поколение Transformer Engine на NVIDIA с персонализирана Blackwell Tensor Core технология, комбинирана с иновации като TensorRT-LLM и NeMo Framework за ускоряване както на инференцията, така и на обучението на големи езикови модели. Blackwell Ultra Tensor Core осигуряват 2 пъти по-бърза обработка на attention-слоеве и 1,5 пъти повече AI изчислителни FLOPS спрямо стандартните Blackwell GPU.

Според NVIDIA, фамилията Blackwell Ultra достига до 15 петаFLOPS плътна 4-битова floating-point производителност и до 288 GB HBM3e памет на чип. Това е особено важно за AI инференцията, която е основно ограничена от паметта — колкото повече памет има, толкова по-големи модели могат да се обслужват. Иън Бък, вицепрезидент на NVIDIA за хиперскейл и HPC, твърди, че Blackwell Ultra ще позволи reasoning моделите да се обслужват с 10 пъти по-голям пропускателен капацитет спрямо предишното поколение Hopper, като времето за отговор ще спадне от над минута до едва десет секунди.

NVIDIA се изправя срещу нарастваща конкуренция от AMD, която наскоро пусна серията MI300 за AI натоварвания и вече намира приложение при компании, търсещи алтернатива на фона на ограниченията в доставките на NVIDIA. През 2025 г. AMD обяви придобиването на инженери по AI хардуер и софтуер от Untether AI, за да засили възможностите си за инференция. Amazon също демонстрира амбиции да контролира цялата AI инфраструктурна верига със своите чипове Graviton4 и Trainium от Project Rainier, успешно обучавайки големи AI модели като Claude 4 на хардуер, различен от този на NVIDIA.

Въпреки тези предизвикателства, анализаторите прогнозират, че продажбите на NVIDIA в сегмента на дейта центровете ще достигнат 200 милиарда долара през 2025 г., като компанията ще запази около 80-85% пазарен дял в краткосрочен план. Стратегията на компанията с Blackwell Ultra изглежда е насочена към затвърждаване на позициите ѝ на пазара за инференция, като същевременно продължава да иновира в обучението, което потенциално може да промени схващането, че водещите AI модели трябва да разчитат изключително на хардуера на NVIDIA.

Source: Technologyreview

Latest News