Anthropic dosáhl významného milníku ve vývoji umělé inteligence, když jeho model Claude 4 Opus prokázal programátorské schopnosti na úrovni zkušených lidských programátorů.
Model Claude 4 Opus, uvedený na trh v květnu 2025, se stal vedoucím AI nástrojem pro programování a dosáhl rekordního skóre 72,5 % v náročném benchmarku SWE-bench, který testuje výkon na reálných úlohách z GitHubu. To výrazně překonává model OpenAI GPT-4.1, jenž ve stejném testu získal 54,6 %.
To, co Claude 4 Opus odlišuje, je jeho bezprecedentní schopnost udržet pozornost a kontext po dlouhou dobu. Během testování ve společnosti Rakuten model samostatně pracoval na komplexním open-source refaktoringovém projektu téměř sedm hodin v kuse, aniž by ztratil soustředění nebo koherenci. Díky tomu se AI posouvá z role rychlého pomocníka na skutečného spolupracovníka pro celodenní projekty.
S kontextovým oknem o velikosti 200 000 tokenů dokáže Claude 4 Opus zpracovávat celé podnikové kódové základny, zvládat složité změny napříč více soubory a přizpůsobit se specifickým programátorským stylům, přičemž poskytuje špičkovou kvalitu při rozsáhlých generovacích a refaktoringových projektech. Podle zpětné vazby vývojářů model vykazuje dovednosti odpovídající programátorovi s PhD a několikaletou praxí.
Tento pokrok znamená víc než jen technický posun – signalizuje zásadní změnu v přístupu organizací k práci s informacemi. Úkoly, které dříve vyžadovaly nepřetržitou lidskou pozornost, lze nyní svěřit AI systémům, které udrží soustředění a kontext celé hodiny či dny. Ekonomické dopady jsou značné, zejména protože analytici předpovídají, že rok 2025 bude obdobím, kdy začnou být výrazně nahrazována pracovní místa na vstupní úrovni v oblasti zákaznických služeb ve zdravotnictví, finančnictví a právu.
Claude 4 Opus vyniká nejen v programování, ale prokazuje také silné schopnosti v oblasti výzkumu, psaní a vědeckého objevování. Model je dostupný prostřednictvím několika kanálů, včetně API společnosti Anthropic, Amazon Bedrock a Google Cloud Vertex AI, přičemž ceny začínají na 15 dolarech za milion vstupních tokenů a 75 dolarech za milion výstupních tokenů.
Jak se systémy AI jako Claude 4 Opus dále vyvíjejí, výzvou pro organizace již není otázka, zda AI dokáže vyrovnat lidským dovednostem, ale jak se přizpůsobit budoucnosti, v níž budou našimi nejproduktivnějšími spolupracovníky stále častěji digitální entity místo lidí.