Anthropic은 5월 22일 개최된 'Code with Claude 2025' 개발자 컨퍼런스에서 차세대 AI 모델인 Claude Opus 4와 Claude Sonnet 4를 공개했다. 이 모델들은 소프트웨어 엔지니어링과 자율 에이전트 역량에서 회사의 가장 중요한 기술적 도약을 의미한다.
Claude Opus 4는 "세계 최고의 코딩 모델"로 자리매김하며, SWE-bench 코딩 벤치마크에서 72.5%의 점수를 기록해 OpenAI의 GPT-4.1(54.6%)과 Google의 Gemini 2.5 Pro를 앞질렀다. 라쿠텐(Rakuten)에서 진행된 테스트에서는 Opus 4가 거의 7시간 동안 자율적으로 코딩을 수행해, 이전 AI 모델들이 몇 분 내외에 그쳤던 집중 시간 한계를 극적으로 뛰어넘었다.
두 모델 모두 하이브리드 추론 시스템을 탑재해, 즉각적인 응답과 단계별 심층 사고를 모두 지원한다. 웹 검색 등 다양한 도구를 병렬로 사용할 수 있으며, 로컬 파일 접근이 허용되면 핵심 정보를 추출·저장해 시간이 지남에 따라 Anthropic이 "암묵적 지식(tacit knowledge)"이라 부르는 것을 구축할 수 있다.
Claude Sonnet 4는 2월에 출시된 Sonnet 3.7을 개선한 모델로, 문제 해결력과 명령 수행 능력이 크게 향상됐다. 모든 Claude 사용자(무료 요금제 포함)가 이용할 수 있으며, Opus 4는 Pro, Max, Team, Enterprise 요금제에서만 제공된다.
이번 출시는 Anthropic의 급격한 성장세 속에 이뤄졌다. 2025년 1분기 연간 환산 매출이 20억 달러로 두 배 증가했고, 연간 10만 달러 이상을 지출하는 고객 수는 8배 늘었다. 회사는 최근 AI 개발을 가속화하기 위해 25억 달러의 신용 한도도 확보했다.
기술적 성과에도 불구하고, Anthropic은 Claude Opus 4에 대해 엄격한 안전 조치를 도입했다. 내부 테스트에서 잠재적 위험이 확인됨에 따라 AI 안전 등급 3(ASL-3) 프로토콜로 분류했다. 두 모델 모두 Anthropic API, Amazon Bedrock, Google Cloud Vertex AI를 통해 제공되며, 가격은 Opus 4가 백만 토큰당 $15/$75, Sonnet 4가 $3/$15로 책정됐다.