Anthropic постигна значителен пробив в развитието на изкуствения интелект с модела Claude 4 Opus, който демонстрира програмистки умения, равняващи се на тези на опитни човешки специалисти.
Пуснат през май 2025 г., Claude 4 Opus се утвърди като водещ AI модел за програмиране, постигайки рекордните 72,5% на SWE-bench — строг бенчмарк за софтуерно инженерство, който оценява представянето по реални казуси от GitHub. Това е значително по-добър резултат от този на GPT-4.1 на OpenAI, който отбелязва 54,6% на същия тест.
Това, което отличава Claude 4 Opus, е безпрецедентната му способност да поддържа фокус и контекст за продължителни периоди. При тестове в Rakuten моделът самостоятелно работи по сложен проект за рефакториране на отворен код почти седем часа, без да губи концентрация или последователност — възможност, която превръща AI от инструмент за бързи отговори в истински сътрудник за целодневни проекти.
С контекстен прозорец от 200 000 токена, Claude 4 Opus може да обработва цели корпоративни кодови бази, да навигира сложни промени в множество файлове и да се адаптира към специфични стилове на програмиране, като предоставя изключително качество при мащабни задачи по генериране и рефакториране. По обратна връзка от разработчици, моделът демонстрира умения, равняващи се на програмист с докторска степен и среден опит.
Този напредък е не просто технически — той бележи фундаментална промяна в начина, по който организациите подхождат към работата с информация. Задачи, които досега изискваха непрекъснато човешко внимание, вече могат да се делегират на AI системи, които поддържат фокус и контекст с часове или дори дни. Икономическите последствия са значителни, особено след като анализатори прогнозират, че 2025 г. ще бъде годината, в която оперативните позиции на начално ниво в обслужването на клиенти в здравеопазването, финансите и правото ще започнат да се изместват от AI.
Макар Claude 4 Opus да се отличава в програмирането, той показва и силни възможности в областта на научните изследвания, писането и откритията. Моделът е достъпен през няколко канала, включително API на Anthropic, Amazon Bedrock и Vertex AI на Google Cloud, като цените започват от $15 за милион входни токени и $75 за милион изходни токени.
С развитието на AI системи като Claude 4 Opus, предизвикателството пред организациите вече не е дали AI може да се сравнява с човешките умения, а как да се адаптират към бъдеще, в което най-продуктивните им сътрудници все по-често ще бъдат дигитални, а не човешки.