Компания Anthropic достигла значимого рубежа в развитии искусственного интеллекта: её модель Claude 4 Opus продемонстрировала навыки программирования, сопоставимые с уровнем опытных специалистов.
Выпущенная в мае 2025 года, Claude 4 Opus зарекомендовала себя как ведущая модель для программирования на базе ИИ, установив рекорд — 72,5% на сложном бенчмарке SWE-bench, который оценивает работу с реальными задачами из GitHub. Для сравнения, GPT-4.1 от OpenAI показал результат 54,6% на том же тесте.
Главное отличие Claude 4 Opus — беспрецедентная способность сохранять фокус и контекст на протяжении длительного времени. В ходе тестирования в компании Rakuten модель самостоятельно работала над сложным проектом по рефакторингу open-source почти семь часов, не теряя концентрации и логической связности. Это превращает ИИ из инструмента для быстрых ответов в полноценного партнёра для проектов, рассчитанных на целый рабочий день.
Благодаря контекстному окну в 200 000 токенов Claude 4 Opus может обрабатывать целые корпоративные кодовые базы, выполнять сложные изменения в нескольких файлах и адаптироваться к специфическим стилям программирования, обеспечивая высокое качество при масштабной генерации и рефакторинге кода. По отзывам разработчиков, модель демонстрирует навыки, эквивалентные специалисту-программисту с учёной степенью и средним опытом работы.
Этот прорыв — не просто технологический успех, а фундаментальный сдвиг в подходе организаций к работе с интеллектуальными задачами. Задачи, ранее требовавшие постоянного человеческого внимания, теперь могут быть делегированы ИИ-системам, способным сохранять фокус и контекст часами и даже днями. Экономические последствия значительны: аналитики прогнозируют, что уже в 2025 году начнётся массовое вытеснение начальных операционных позиций в клиентском обслуживании в сферах здравоохранения, финансов и юриспруденции.
Хотя Claude 4 Opus особенно силён в программировании, он также демонстрирует выдающиеся способности в исследовательской деятельности, написании текстов и научных открытиях. Модель доступна через различные каналы, включая API Anthropic, Amazon Bedrock и Vertex AI от Google Cloud. Стоимость начинается от $15 за миллион входных токенов и $75 за миллион выходных токенов.
По мере развития подобных систем задача для организаций меняется: теперь вопрос не в том, сможет ли ИИ сравниться с человеком, а в том, как адаптироваться к будущему, где самыми продуктивными коллегами всё чаще будут цифровые, а не человеческие сотрудники.