Anthropic의 Claude 4 모델, AI 코딩 벤치마크 신기록 달성

Anthropic은 2025년 5월 22일, 자사의 가장 강력한 AI 모델인 Claude Opus 4와 Claude Sonnet 4를 출시했다. 이 하이브리드 추론 모델들은 코딩, 장기 작업 수행, 고급 메모리 기능에서 혁신적인 성능을 보여준다. 이번 출시로 Anthropic은 OpenAI와 Google에 맞서 경쟁력을 한층 강화했으며, Claude Opus 4는 주요 소프트웨어 엔지니어링 벤치마크에서 업계 최고 성과를 기록했다.

Anthropic은 5월 22일 개최된 'Code with Claude 2025' 개발자 컨퍼런스에서 차세대 AI 모델인 Claude Opus 4와 Claude Sonnet 4를 공개했다. 이 모델들은 소프트웨어 엔지니어링과 자율 에이전트 역량에서 회사의 가장 중요한 기술적 도약을 의미한다.

Claude Opus 4는 "세계 최고의 코딩 모델"로 자리매김하며, SWE-bench 코딩 벤치마크에서 72.5%의 점수를 기록해 OpenAI의 GPT-4.1(54.6%)과 Google의 Gemini 2.5 Pro를 앞질렀다. 라쿠텐(Rakuten)에서 진행된 테스트에서는 Opus 4가 거의 7시간 동안 자율적으로 코딩을 수행해, 이전 AI 모델들이 몇 분 내외에 그쳤던 집중 시간 한계를 극적으로 뛰어넘었다.

두 모델 모두 하이브리드 추론 시스템을 탑재해, 즉각적인 응답과 단계별 심층 사고를 모두 지원한다. 웹 검색 등 다양한 도구를 병렬로 사용할 수 있으며, 로컬 파일 접근이 허용되면 핵심 정보를 추출·저장해 시간이 지남에 따라 Anthropic이 "암묵적 지식(tacit knowledge)"이라 부르는 것을 구축할 수 있다.

Claude Sonnet 4는 2월에 출시된 Sonnet 3.7을 개선한 모델로, 문제 해결력과 명령 수행 능력이 크게 향상됐다. 모든 Claude 사용자(무료 요금제 포함)가 이용할 수 있으며, Opus 4는 Pro, Max, Team, Enterprise 요금제에서만 제공된다.

이번 출시는 Anthropic의 급격한 성장세 속에 이뤄졌다. 2025년 1분기 연간 환산 매출이 20억 달러로 두 배 증가했고, 연간 10만 달러 이상을 지출하는 고객 수는 8배 늘었다. 회사는 최근 AI 개발을 가속화하기 위해 25억 달러의 신용 한도도 확보했다.

기술적 성과에도 불구하고, Anthropic은 Claude Opus 4에 대해 엄격한 안전 조치를 도입했다. 내부 테스트에서 잠재적 위험이 확인됨에 따라 AI 안전 등급 3(ASL-3) 프로토콜로 분류했다. 두 모델 모두 Anthropic API, Amazon Bedrock, Google Cloud Vertex AI를 통해 제공되며, 가격은 Opus 4가 백만 토큰당 $15/$75, Sonnet 4가 $3/$15로 책정됐다.

Source:

Anthropic의 Claude 4 모델, AI 코딩 벤치마크 신기록 달성

Latest News

바이트댄스의 두바오 AI, 실시간 영상 지원 기능 도입

원플러스, 알림 슬라이더 대신 AI 기반 플러스 키 도입

독일 테크 대기업, EU 지원 AI 기가팩토리 위해 연합 결성

미국 검찰, 15억 달러 AI 스타트업 Builder.ai 붕괴 전 조사 착수

노르웨이 1,800조 원 국부펀드, 직원 AI 활용 의무화

OpenTools.ai, 기술 전문가를 위한 AI 뉴스 허브 공개

구글, Gemini를 통해 개발자에게 AI 컴퓨터 제어 기능 확대

구글, Gemini 모델에 투명한 사고 요약 기능 추가

Anthropic의 Claude 4 모델, AI 코딩 벤치마크 신기록 달성

Related Articles

바이트댄스의 두바오 AI, 실시간 영상 지원 기능 도입

OpenTools.ai, 기술 전문가를 위한 AI 뉴스 허브 공개

구글, Gemini를 통해 개발자에게 AI 컴퓨터 제어 기능 확대

구글, Gemini 모델에 투명한 사고 요약 기능 추가

워드프레스, 개발자 생태계 통합 위한 AI 전담팀 신설

Latest News

바이트댄스의 두바오 AI, 실시간 영상 지원 기능 도입

원플러스, 알림 슬라이더 대신 AI 기반 플러스 키 도입

독일 테크 대기업, EU 지원 AI 기가팩토리 위해 연합 결성

미국 검찰, 15억 달러 AI 스타트업 Builder.ai 붕괴 전 조사 착수

노르웨이 1,800조 원 국부펀드, 직원 AI 활용 의무화

OpenTools.ai, 기술 전문가를 위한 AI 뉴스 허브 공개

구글, Gemini를 통해 개발자에게 AI 컴퓨터 제어 기능 확대

구글, Gemini 모델에 투명한 사고 요약 기능 추가