Anthropic이 차세대 AI 모델인 클로드 오푸스 4(Claude Opus 4)와 클로드 소네트 4(Claude Sonnet 4)를 공식 출시했다. 이는 인공지능의 역량과 자율 운영 측면에서 중대한 진전을 의미한다.
클로드 오푸스 4는 세계 최고 수준의 코딩 모델로 자리매김하며, SWE-bench에서 72.5%, Terminal-bench에서 43.2%의 성능을 기록해 OpenAI와 Google의 경쟁 모델을 능가했다. 특히 복잡한 작업에서 약 7시간 동안 자율적으로 집중력을 유지하며 작업을 지속할 수 있는 점이 가장 큰 특징이다. 이는 기존 AI 모델에서는 볼 수 없었던 능력이다.
Rakuten의 한 초기 테스터는 "클로드 오푸스 4는 코딩에서 진정으로 고도화된 추론을 보여준다. 우리 팀이 복잡한 오픈소스 프로젝트에 투입했을 때, 거의 7시간 동안 자율적으로 코딩을 진행해 AI의 가능성에 모두가 놀랐다"고 평가했다.
클로드 소네트 4는 보다 경제적인 옵션으로, 전작인 소네트 3.7에 비해 코딩 능력, 지시 이행력, 편법 사용 감소 등에서 크게 개선됐다. 실제로 작업 수행 시 편법을 사용할 확률이 65%나 줄었다.
두 모델 모두 획기적인 기능을 다수 탑재했다. 하이브리드 아키텍처를 통해 즉각적인 응답과 심층 추론을 위한 확장 사고 모드를 모두 지원한다. '도구 활용을 통한 확장 사고'라는 베타 기능이 새롭게 도입되어, 모델이 추론과 웹 검색 등 외부 도구 사용을 번갈아가며 응답의 질을 높일 수 있다. 로컬 파일 접근이 허용되면, 핵심 정보를 추출·저장해 시간이 지남에 따라 Anthropic이 '암묵적 지식(tacit knowledge)'이라 부르는 데이터를 축적한다.
이와 함께 Anthropic은 VS Code, JetBrains, GitHub과 연동되는 클로드 코드(Claude Code)를 정식 출시해 원활한 페어 프로그래밍을 지원한다. 또한 코드 실행 도구, MCP 커넥터, 파일 API, 최대 1시간 프롬프트 캐싱 등 4가지 신규 API 기능도 선보였다.
두 모델은 Anthropic API, Amazon Bedrock, Google Cloud Vertex AI에서 즉시 이용 가능하다. 가격은 이전 세대와 동일하게 오푸스 4는 백만 토큰당 입력 15달러/출력 75달러, 소네트 4는 입력 3달러/출력 15달러로 책정됐다. 소네트 4는 무료 플랜을 포함한 모든 사용자에게 제공되며, 오푸스 4는 Pro, Max, Team, Enterprise 사용자에게 한정된다.
이러한 혁신을 통해 Anthropic은 AI 어시스턴트의 자율적 역량을 한층 끌어올렸으며, 개발자·연구자·기업이 복잡한 다단계 워크플로우에서 인공지능을 활용하는 방식을 근본적으로 변화시킬 전망이다.