OpenAI predstavuje rodinu GPT-4.1 s cieľom ovládnuť trh AI programovania

OpenAI uviedol novú rodinu modelov s názvom GPT-4.1, ktorá zahŕňa štandardnú, mini a nano verziu, všetky optimalizované na programovanie a nasledovanie inštrukcií s obrovským kontextovým oknom na úrovni 1 milióna tokenov. Tieto modely, dostupné výhradne cez API, prekonávajú predchádzajúce ponuky OpenAI v programovacích benchmarkoch, pričom vlajková loď GPT-4.1 dosahuje o 21 % lepšie výsledky než GPT-4o. Tento krok prichádza v čase, keď sa konkurencia zostruje – o dominanciu v oblasti AI programovania sa usilujú aj Google s Gemini 2.5 Pro a Anthropic s Claude 3.7 Sonnet.

OpenAI uviedol na trh novú rodinu modelov s názvom GPT-4.1, vrátane GPT-4.1, GPT-4.1 mini a GPT-4.1 nano, ktoré vynikajú v programovaní a nasledovaní inštrukcií. Modely boli predstavené 14. apríla a sú dostupné výhradne prostredníctvom aplikačného programovacieho rozhrania (API) OpenAI. Vo všetkých smeroch prekonávajú doteraz najpokročilejší model spoločnosti, GPT-4o.

Tieto modely disponujú vylepšeným chápaním kontextu, podporujú až 1 milión tokenov (približne 750 000 slov) a sú vybavené aktualizovanými znalosťami do júna 2024. V benchmarku SWE-bench Verified, ktorý meria reálne softvérové inžinierske schopnosti, GPT-4.1 zvládne 54,6 % úloh, zatiaľ čo GPT-4o dosahuje 33,2 %. To odráža zlepšenia v schopnosti modelu prehľadávať kódové repozitáre, dokončovať úlohy a generovať kód, ktorý nielen funguje, ale aj prejde testami.

„GPT-4.1 sme optimalizovali na reálne použitie na základe priamej spätnej väzby, aby sme sa zlepšili v oblastiach, na ktorých vývojárom najviac záleží: frontend programovanie, menej zbytočných úprav, spoľahlivé dodržiavanie formátov, presné zachovanie štruktúry a poradia odpovedí, konzistentné používanie nástrojov a ďalšie,“ vysvetlil hovorca OpenAI. „Tieto vylepšenia umožňujú vývojárom vytvárať agentov, ktorí sú výrazne lepší v reálnych softvérových inžinierskych úlohách.“

Menšie varianty ponúkajú rôzne kompromisy medzi výkonom a cenou. GPT-4.1 mini a nano sú efektívnejšie a rýchlejšie, avšak za cenu mierne nižšej presnosti. OpenAI tvrdí, že GPT-4.1 nano je najrýchlejší a najlacnejší model v histórii firmy. Ceny sa výrazne líšia: GPT-4.1 stojí 2 USD za milión vstupných tokenov a 8 USD za milión výstupných tokenov, GPT-4.1 mini je za 0,40 USD/milión vstupných a 1,60 USD/milión výstupných tokenov, pričom GPT-4.1 nano len 0,10 USD/milión vstupných a 0,40 USD/milión výstupných tokenov.

Pri hodnoteniach mimo oblasti programovania testoval OpenAI GPT-4.1 pomocou Video-MME, ktorý meria schopnosť modelu porozumieť obsahu vo videách. GPT-4.1 dosiahol 72 % presnosť v kategórii „dlhé videá bez titulkov“ a obsadil tak prvé miesto v tomto benchmarku.

Toto vydanie je v súlade s širšími ambíciami OpenAI v oblasti programovania. Finančná riaditeľka OpenAI Sarah Friar nedávno predstavila víziu spoločnosti vytvoriť „agentného softvérového inžiniera“, ktorý dokáže naprogramovať celé aplikácie od začiatku do konca. „Dokáže pre vás doslova postaviť aplikáciu – a nielen ju vytvoriť, ale aj vykonať vlastnú kontrolu kvality, testovanie chýb a písanie dokumentácie,“ uviedla Friar.

Oblasť AI modelov na programovanie je čoraz konkurenčnejšia. Google Gemini 2.5 Pro aktuálne vedie v benchmarku SWE-bench Verified s 63,8 %, zatiaľ čo Anthropic Claude 3.7 Sonnet dosahuje v štandardnom režime 62,3 % a v režime rozšíreného uvažovania až 70,3 %. Napriek týmto pôsobivým výsledkom OpenAI priznáva, že aj najlepšie dnešné modely stále zápasia s úlohami, ktoré by odborníkov nezaskočili. Mnohé štúdie ukázali, že modely generujúce kód často nedokážu opraviť, ba dokonca zavádzajú bezpečnostné zraniteľnosti a chyby. GPT-4.1 je tiež menej spoľahlivý pri spracovaní väčšieho množstva vstupných tokenov.

OpenAI predstavuje rodinu GPT-4.1 s cieľom ovládnuť trh AI programovania

Latest News

ByteDance rozširuje Doubao AI o asistenciu v reálnom čase cez video

OnePlus nahrádza ikonický prepínač režimov novým AI tlačidlom Plus Key

Nemeckí technologickí giganti sa spájajú pre AI gigatováreň podporovanú EÚ

Americkí prokurátori vyšetrovali Builder.ai pred krachom AI startupu v hodnote 1,5 miliardy dolárov

Nórsky fond v hodnote 1,8 bilióna dolárov zavádza povinné využívanie AI pre zamestnancov

OpenTools.ai predstavuje AI News Hub pre technologických profesionálov

Google rozširuje ovládanie počítača pomocou AI pre vývojárov cez Gemini

Google vylepšuje modely Gemini transparentnými súhrnmi myšlienok

OpenAI predstavuje rodinu GPT-4.1 s cieľom ovládnuť trh AI programovania

Related Articles

ByteDance rozširuje Doubao AI o asistenciu v reálnom čase cez video

OnePlus nahrádza ikonický prepínač režimov novým AI tlačidlom Plus Key

Nemeckí technologickí giganti sa spájajú pre AI gigatováreň podporovanú EÚ

Latest News

ByteDance rozširuje Doubao AI o asistenciu v reálnom čase cez video

OnePlus nahrádza ikonický prepínač režimov novým AI tlačidlom Plus Key

Nemeckí technologickí giganti sa spájajú pre AI gigatováreň podporovanú EÚ

Americkí prokurátori vyšetrovali Builder.ai pred krachom AI startupu v hodnote 1,5 miliardy dolárov

Nórsky fond v hodnote 1,8 bilióna dolárov zavádza povinné využívanie AI pre zamestnancov

OpenTools.ai predstavuje AI News Hub pre technologických profesionálov

Google rozširuje ovládanie počítača pomocou AI pre vývojárov cez Gemini

Google vylepšuje modely Gemini transparentnými súhrnmi myšlienok