Anthropic досягла значного прориву у розвитку штучного інтелекту: модель Claude 4 Opus продемонструвала навички програмування, які відповідають рівню досвідчених людських фахівців.
Випущена у травні 2025 року, Claude 4 Opus стала провідною ШІ-моделлю для кодування, встановивши рекордний результат у 72,5% на SWE-bench — суворому бенчмарку програмної інженерії, що оцінює продуктивність на реальних задачах з GitHub. Це суттєво перевищує показник GPT-4.1 від OpenAI, який склав 54,6% на тому ж тесті.
Головна перевага Claude 4 Opus — безпрецедентна здатність зберігати фокус і контекст протягом тривалого часу. Під час тестування у компанії Rakuten модель самостійно працювала над складним проєктом з рефакторингу відкритого коду майже сім годин без втрати концентрації чи послідовності — це перетворює ШІ з інструменту швидких відповідей на справжнього колегу для проєктів, що тривають цілий день.
Завдяки вікну контексту у 200 000 токенів Claude 4 Opus може обробляти цілі корпоративні кодові бази, орієнтуватися у складних змінах між багатьма файлами та адаптуватися до конкретних стилів програмування, забезпечуючи високу якість для масштабних завдань з генерації та рефакторингу. За відгуками розробників, модель демонструє навички, еквівалентні програмісту з PhD середньої кар'єри.
Цей прорив — не лише технічний прогрес, а й фундаментальна зміна у підході організацій до роботи з інформацією. Завдання, які раніше вимагали постійної уваги людини, тепер можна делегувати ШІ-системам, що здатні зберігати контекст і фокус годинами чи навіть днями. Економічні наслідки значні, особливо з огляду на прогнози аналітиків: 2025 рік стане початком масового витіснення початкових операційних посад у сфері обслуговування клієнтів у галузях охорони здоров'я, фінансів і права.
Окрім програмування, Claude 4 Opus демонструє високі результати у дослідженнях, написанні текстів і наукових відкриттях. Модель доступна через різні канали, зокрема API Anthropic, Amazon Bedrock і Vertex AI від Google Cloud. Вартість починається від $15 за мільйон вхідних токенів і $75 за мільйон вихідних токенів.
У міру розвитку таких систем, як Claude 4 Opus, для організацій постає новий виклик: не питання, чи може ШІ зрівнятися з людськими навичками, а як адаптуватися до майбутнього, де нашими найпродуктивнішими колегами дедалі частіше ставатимуть цифрові, а не людські співробітники.