menu
close

OpenAI predstavuje rodinu GPT-4.1 s cieľom ovládnuť trh AI programovania

OpenAI uviedol novú rodinu modelov s názvom GPT-4.1, ktorá zahŕňa štandardnú, mini a nano verziu, všetky optimalizované na programovanie a nasledovanie inštrukcií s obrovským kontextovým oknom na úrovni 1 milióna tokenov. Tieto modely, dostupné výhradne cez API, prekonávajú predchádzajúce ponuky OpenAI v programovacích benchmarkoch, pričom vlajková loď GPT-4.1 dosahuje o 21 % lepšie výsledky než GPT-4o. Tento krok prichádza v čase, keď sa konkurencia zostruje – o dominanciu v oblasti AI programovania sa usilujú aj Google s Gemini 2.5 Pro a Anthropic s Claude 3.7 Sonnet.
OpenAI predstavuje rodinu GPT-4.1 s cieľom ovládnuť trh AI programovania

OpenAI uviedol na trh novú rodinu modelov s názvom GPT-4.1, vrátane GPT-4.1, GPT-4.1 mini a GPT-4.1 nano, ktoré vynikajú v programovaní a nasledovaní inštrukcií. Modely boli predstavené 14. apríla a sú dostupné výhradne prostredníctvom aplikačného programovacieho rozhrania (API) OpenAI. Vo všetkých smeroch prekonávajú doteraz najpokročilejší model spoločnosti, GPT-4o.

Tieto modely disponujú vylepšeným chápaním kontextu, podporujú až 1 milión tokenov (približne 750 000 slov) a sú vybavené aktualizovanými znalosťami do júna 2024. V benchmarku SWE-bench Verified, ktorý meria reálne softvérové inžinierske schopnosti, GPT-4.1 zvládne 54,6 % úloh, zatiaľ čo GPT-4o dosahuje 33,2 %. To odráža zlepšenia v schopnosti modelu prehľadávať kódové repozitáre, dokončovať úlohy a generovať kód, ktorý nielen funguje, ale aj prejde testami.

„GPT-4.1 sme optimalizovali na reálne použitie na základe priamej spätnej väzby, aby sme sa zlepšili v oblastiach, na ktorých vývojárom najviac záleží: frontend programovanie, menej zbytočných úprav, spoľahlivé dodržiavanie formátov, presné zachovanie štruktúry a poradia odpovedí, konzistentné používanie nástrojov a ďalšie,“ vysvetlil hovorca OpenAI. „Tieto vylepšenia umožňujú vývojárom vytvárať agentov, ktorí sú výrazne lepší v reálnych softvérových inžinierskych úlohách.“

Menšie varianty ponúkajú rôzne kompromisy medzi výkonom a cenou. GPT-4.1 mini a nano sú efektívnejšie a rýchlejšie, avšak za cenu mierne nižšej presnosti. OpenAI tvrdí, že GPT-4.1 nano je najrýchlejší a najlacnejší model v histórii firmy. Ceny sa výrazne líšia: GPT-4.1 stojí 2 USD za milión vstupných tokenov a 8 USD za milión výstupných tokenov, GPT-4.1 mini je za 0,40 USD/milión vstupných a 1,60 USD/milión výstupných tokenov, pričom GPT-4.1 nano len 0,10 USD/milión vstupných a 0,40 USD/milión výstupných tokenov.

Pri hodnoteniach mimo oblasti programovania testoval OpenAI GPT-4.1 pomocou Video-MME, ktorý meria schopnosť modelu porozumieť obsahu vo videách. GPT-4.1 dosiahol 72 % presnosť v kategórii „dlhé videá bez titulkov“ a obsadil tak prvé miesto v tomto benchmarku.

Toto vydanie je v súlade s širšími ambíciami OpenAI v oblasti programovania. Finančná riaditeľka OpenAI Sarah Friar nedávno predstavila víziu spoločnosti vytvoriť „agentného softvérového inžiniera“, ktorý dokáže naprogramovať celé aplikácie od začiatku do konca. „Dokáže pre vás doslova postaviť aplikáciu – a nielen ju vytvoriť, ale aj vykonať vlastnú kontrolu kvality, testovanie chýb a písanie dokumentácie,“ uviedla Friar.

Oblasť AI modelov na programovanie je čoraz konkurenčnejšia. Google Gemini 2.5 Pro aktuálne vedie v benchmarku SWE-bench Verified s 63,8 %, zatiaľ čo Anthropic Claude 3.7 Sonnet dosahuje v štandardnom režime 62,3 % a v režime rozšíreného uvažovania až 70,3 %. Napriek týmto pôsobivým výsledkom OpenAI priznáva, že aj najlepšie dnešné modely stále zápasia s úlohami, ktoré by odborníkov nezaskočili. Mnohé štúdie ukázali, že modely generujúce kód často nedokážu opraviť, ba dokonca zavádzajú bezpečnostné zraniteľnosti a chyby. GPT-4.1 je tiež menej spoľahlivý pri spracovaní väčšieho množstva vstupných tokenov.

Source: TechCrunch

Latest News