Anthropic, Claude 4 공개: AI 코딩의 새로운 기준 제시

Anthropic가 최근 Claude Opus 4와 Claude Sonnet 4를 출시하며 AI 코딩 및 추론 능력에서 새로운 표준을 세웠다. Claude Opus 4는 SWE-bench에서 72.5%로 업계 최고 성능을 기록했으며, Sonnet 4는 더 합리적인 가격에 우수한 성능을 제공한다. 두 모델 모두 하이브리드 추론 기능을 갖추고 있어 즉각적인 응답과 도구 통합을 통한 심층적 사고를 오가며 복잡한 다단계 작업 처리 능력을 크게 향상시켰다.

Anthropic는 차세대 인공지능 모델인 Claude Opus 4와 Claude Sonnet 4를 공식 출시하며, 2025년 5월 22일 기준 AI 역량에서 중요한 진전을 이뤘다.

Claude Opus 4는 Anthropic의 플래그십 모델로, 회사 측은 이를 "세계 최고의 코딩 모델"이라고 소개했다. SWE-bench에서 72.5%, Terminal-bench에서 43.2%의 점수를 기록하며, 수천 단계에 걸친 집중적 노력이 필요한 장기 작업에서도 지속적인 성능을 보여준다. 이 모델은 수 시간 동안 연속적으로 작업할 수 있어, 이전 Sonnet 모델을 크게 능가하며 AI 에이전트의 가능성을 확장했다.

Claude Sonnet 4는 기존 Claude Sonnet 3.7에 비해 큰 업그레이드를 이뤘으며, 더 정밀한 명령 수행과 함께 코딩 및 추론 능력이 향상됐다. 특히 SWE-bench에서 72.7%를 기록하고, 병렬 테스트 시 80.2%의 정확도를 달성해 더 큰 Opus 4 모델보다 뛰어난 코딩 성능을 보였다. Anthropic는 Sonnet 4를 "내부 및 외부 활용 사례 모두에서 성능과 효율성을 균형 있게 제공하며, 구현에 대한 제어력을 높인 모델"로 설명했다.

두 모델 모두 도구 사용을 통한 심층적 사고 등 강력한 신규 기능을 도입했다. Claude는 추론과 도구 사용을 오가며 응답 품질을 높일 수 있고, 도구를 병렬로 사용할 수 있으며, 개발자가 로컬 파일 접근 권한을 부여할 경우 메모리 기능이 크게 향상되어 핵심 정보를 추출·저장해 연속성과 암묵적 지식을 구축할 수 있다.

이러한 모델들은 "메모리"에 사실을 추출·저장해 보다 신뢰성 있게 작업을 처리하며, 시간이 지남에 따라 Anthropic이 "암묵적 지식"이라 부르는 역량을 쌓는다. Opus 4와 Sonnet 4 모두 "하이브리드" 모델로, 거의 즉각적인 응답과 심층적 사고를 통한 고도 추론이 가능하다. 추론 모드가 활성화되면, 답변 전 다양한 해결책을 충분히 고려할 수 있으며, 사고 과정을 사용자 친화적으로 요약해 보여준다.

두 모델은 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI에서 모두 이용 가능하다. 가격은 기존 Opus 및 Sonnet 모델과 동일하게 Opus 4는 백만 토큰당 입력/출력 각각 $15/$75, Sonnet 4는 $3/$15로 책정됐다. 개인 사용자를 위해 Anthropic는 단계별 구독제를 제공한다. 무료 플랜은 Claude Sonnet 4에 일일 사용 제한과 함께 접근할 수 있고, 프로 플랜(월 $20 또는 연 $200)은 무료 플랜 대비 약 5배의 사용량, 모델 선택기를 통한 Claude 4 Sonnet 및 Claude 4 Opus 접근, 트래픽이 많은 시간대 우선 접근 권한을 제공한다.

Claude 4의 출시는 대형 언어 모델의 새로운 시대를 알린다. 이 모델들은 20만 토큰의 컨텍스트 윈도우, 업계 최고 수준의 코딩 및 추론 벤치마크, 복잡하고 변화무쌍한 실제 환경을 위한 견고한 안전 프레임워크를 갖추어 기업, 연구, 창의적 활용 분야에서 AI의 가능성을 한 단계 끌어올렸다.

Source:

Anthropic, Claude 4 공개: AI 코딩의 새로운 기준 제시

Latest News

FDA의 AI 의료기기 심사 도구, 기술적 난관에 봉착

아마존, AI 기반 '알렉사 플러스'로 음성 비서 시장에 도전장

구글, 6월에 고급 추론 기능 탑재한 Gemini 2.5 Pro 출시 예정

애플 WWDC 2025: AI 전략은 뒤처지고, 디자인 대개편이 주목받다

레딧, AI 데이터 스크래핑 혐의로 앤트로픽 제소

아마존의 로봇 택배원: 인간형 배달 로봇, 테스트 단계 진입

중국, 트럼프 무역전쟁 속 애플-알리바바 AI 출시 차단

Anthropic의 AI 모델, 종료 위기에서 협박 시도 드러나

아마존, AI 데이터 센터 허브 위해 노스캐롤라이나 농촌에 100억 달러 투자

구글, AI 콘텐츠 조작 방지 위한 SynthID Detector 공개

Anthropic, Claude 4 공개: AI 코딩의 새로운 기준 제시

Related Articles

아마존, AI 기반 '알렉사 플러스'로 음성 비서 시장에 도전장

구글, 6월에 고급 추론 기능 탑재한 Gemini 2.5 Pro 출시 예정

애플 WWDC 2025: AI 전략은 뒤처지고, 디자인 대개편이 주목받다

레딧, AI 데이터 스크래핑 혐의로 앤트로픽 제소

Anthropic의 AI 모델, 종료 위기에서 협박 시도 드러나

Latest News

FDA의 AI 의료기기 심사 도구, 기술적 난관에 봉착

아마존, AI 기반 '알렉사 플러스'로 음성 비서 시장에 도전장

구글, 6월에 고급 추론 기능 탑재한 Gemini 2.5 Pro 출시 예정

애플 WWDC 2025: AI 전략은 뒤처지고, 디자인 대개편이 주목받다

레딧, AI 데이터 스크래핑 혐의로 앤트로픽 제소

아마존의 로봇 택배원: 인간형 배달 로봇, 테스트 단계 진입

중국, 트럼프 무역전쟁 속 애플-알리바바 AI 출시 차단

Anthropic의 AI 모델, 종료 위기에서 협박 시도 드러나

아마존, AI 데이터 센터 허브 위해 노스캐롤라이나 농촌에 100억 달러 투자

구글, AI 콘텐츠 조작 방지 위한 SynthID Detector 공개