menu
close

NVIDIA predstavlja Blackwell Ultra kako bi dominirao tržištem AI inferenciranja

NVIDIA planira lansirati svoju novu generaciju Blackwell Ultra AI čipova u drugoj polovici 2025. godine, posebno dizajniranih za izvrsnost u AI inferenciranju, gdje konkurenti poput Amazona, AMD-a i Broadcoma bilježe napredak. Novi čipovi obećavaju do 1,5 puta veću AI računalnu snagu u odnosu na postojeće Blackwell GPU-ove te značajno prošireni kapacitet memorije. Ovaj strateški potez mogao bi pomoći NVIDIJI da zadrži dominaciju na brzo rastućem tržištu AI inferenciranja, za koje se očekuje da će s vremenom nadmašiti tržište treniranja AI modela.
NVIDIA predstavlja Blackwell Ultra kako bi dominirao tržištem AI inferenciranja

NVIDIA se sprema dodatno učvrstiti svoju poziciju na tržištu AI čipova nadolazećim izdanjem arhitekture Blackwell Ultra, što predstavlja značajnu nadogradnju na Blackwell platformu predstavljenu ranije ove godine.

Iako NVIDIA dominira tržištem treniranja AI modela, tvrtka se suočava s rastućom konkurencijom na području inferenciranja, gdje se AI modeli koriste za generiranje odgovora umjesto za treniranje. Kako AI aplikacije postaju sve složenije i raširenije, stručnjaci iz industrije predviđaju dramatičan rast tržišta inferenciranja u narednim godinama, privlačeći konkurente željne izazvati dominaciju NVIDIJE. Za razliku od treniranja AI modela, koje zahtijeva ogromnu računalnu snagu na razini cijelih podatkovnih centara, inferencijski zadaci su raznolikiji i mogu ih obavljati različiti specijalizirani hardveri.

Očekuje se da će proizvodi temeljeni na Blackwell Ultra arhitekturi biti dostupni partnerima od druge polovice 2025. godine. Među prvim korisnicima Blackwell Ultra instanci bit će veliki pružatelji cloud usluga poput Amazon Web Servicesa, Google Clouda, Microsoft Azurea i Oracle Cloud Infrastructurea, dok će proizvođači servera poput Della, HPE-a, Lenova i Supermicra slijediti s vlastitim implementacijama.

Nova arhitektura koristi NVIDIJINU drugu generaciju Transformer Enginea s prilagođenom Blackwell Tensor Core tehnologijom, u kombinaciji s inovacijama TensorRT-LLM i NeMo Frameworka, kako bi ubrzala i inferenciranje i treniranje velikih jezičnih modela. Blackwell Ultra Tensor Coreovi omogućuju dvostruko brže izvođenje attention slojeva i 1,5 puta više AI računalnih FLOPS-a u odnosu na standardne Blackwell GPU-ove.

Prema NVIDIJI, Blackwell Ultra obitelj čipova nudi do 15 petaFLOPS-a guste 4-bitne floating-point izvedbe i do 288 GB HBM3e memorije po čipu. Ovo je posebno važno za AI inferenciranje, koje je prvenstveno ograničeno memorijom — što je više memorije dostupno, to se veći modeli mogu posluživati. Ian Buck, potpredsjednik NVIDIJE za hyperscale i HPC, tvrdi da će Blackwell Ultra omogućiti posluživanje reasoning modela s 10 puta većim protokom u odnosu na prethodnu Hopper generaciju, smanjujući vrijeme odgovora s više od minute na samo deset sekundi.

NVIDIA se suočava s rastućom konkurencijom od strane AMD-a, koji je nedavno lansirao svoju MI300 seriju za AI zadatke i stekao korisnike među tvrtkama koje traže alternative zbog ograničene dostupnosti NVIDIJINIH čipova. U 2025. AMD je najavio akviziciju AI hardverskih i softverskih inženjera iz Untether AI-a kako bi ojačao svoje mogućnosti inferenciranja. Amazon također pokazuje ambicije za kontrolom cijelog AI infrastrukturnog lanca sa svojim Graviton4 i Project Rainier Trainium čipovima, uspješno trenirajući velike AI modele poput Claude 4 na hardveru koji nije od NVIDIJE.

Unatoč ovim izazovima, analitičari predviđaju da će NVIDIJINA prodaja podatkovnim centrima narasti na 200 milijardi dolara u 2025. godini, zadržavajući otprilike 80-85% tržišnog udjela u bliskoj budućnosti. Strategija tvrtke s Blackwell Ultra čipovima očito je usmjerena na osiguravanje pozicije na tržištu inferenciranja, uz nastavak inovacija u treniranju, što bi potencijalno moglo promijeniti pretpostavku da vrhunski AI modeli moraju nužno ovisiti isključivo o NVIDIJINOM hardveru.

Source: Technologyreview

Latest News