menu
close

딥시크, R1 AI 모델 업그레이드로 서구 기술 대기업에 도전장

중국 AI 스타트업 딥시크가 올해 초 글로벌 주목을 받게 한 R1 추론 모델의 업데이트 버전을 공개했다. 이번 R1-0528 업데이트는 회사 측에서 '소규모'라고 밝혔지만, 코딩 능력, 추론 심도, 글쓰기 작업 등에서 눈에 띄는 성능 향상을 보였다. 딥시크는 비용 효율적인 AI 개발 방식을 유지하면서도 OpenAI와 구글의 모델에 필적하는 성능을 자랑한다.
딥시크, R1 AI 모델 업그레이드로 서구 기술 대기업에 도전장

중국 인공지능 스타트업 딥시크(DeepSeek)가 올해 1월 혁신적인 R1 모델로 기술주를 흔들었던 데 이어, 자사의 대표 AI 시스템에 중요한 업데이트를 조용히 도입했다.

새 버전인 DeepSeek-R1-0528은 5월 28일 회사의 위챗 그룹을 통한 간단한 공지로 공개됐다. 딥시크는 이를 '소규모 시험 업그레이드'라고 설명했지만, 초기 테스트 결과 여러 분야에서 상당한 개선이 확인됐다.

LiveCodeBench 리더보드에 따르면, 이번 업데이트 모델은 코딩 능력에서 Pass@1 점수 73.1로 4위를 차지하며 OpenAI의 O3, O4-Mini 모델 바로 뒤에 올랐다. 이는 서구 경쟁사보다 훨씬 적은 자원으로 개발된 오픈소스 모델로서는 큰 도약이다.

기술 사양을 보면, R1-0528은 전작과 동일한 Mixture-of-Experts(MoE) 아키텍처를 유지하며, 총 약 6850억 개의 파라미터 중 추론 시 약 370억 개만 활성화된다. 또한 최대 128K 토큰의 확장된 컨텍스트 윈도우를 지원해 훨씬 더 방대한 문서와 코드베이스를 처리할 수 있다.

사용자 피드백에 따르면, 추론의 깊이, 글쓰기 품질, 문제 해결 능력 등에서 개선이 두드러진다. 개발자들은 이번 모델이 복잡한 작업에 대해 30~60분에 걸친 장기 추론 세션을 수행할 수 있다고 전했으며, 이는 구글의 모델과 유사한 수준이다. 또한 텍스트 생성에서 이전의 특이점들이 개선되어 더욱 자연스럽고 형식이 잘 갖춰진 결과물을 제공한다.

딥시크의 지속적인 혁신은 AI의 확장이 막대한 컴퓨팅 파워와 투자에만 의존해야 한다는 통념에 도전장을 던진다. 비용 효율적인 오픈소스 모델의 성공은 이미 업계 대기업들의 대응을 이끌어냈으며, OpenAI는 가격을 인하하고 구글은 할인 요금제를 도입했다. 한편, 알리바바, 텐센트 등 중국 내 경쟁사들도 딥시크를 능가한다고 주장하는 자체 모델을 내놓고 있다.

R1-0528 업데이트는 MIT 라이선스 하에 허깅페이스(Hugging Face)에서 제공되며, 상업적 사용과 수정이 가능하다. 업계에서는 딥시크가 앞으로 수개월 내에 더 포괄적인 R2 모델을 공개해 AI 시장에 또 한 번의 변화를 일으킬 것으로 기대하고 있다.

Source:

Latest News