중국 AI 스타트업 딥시크(DeepSeek)가 최신 R1-0528 모델 업데이트를 통해 서구 AI 주도권에 도전장을 내밀었다. 이번 모델은 OpenAI, 구글 등 업계 선두와 견줄 만한 성능을 보여주고 있다.
딥시크는 이번 R1-0528을 '소규모 버전 업그레이드'라고 설명했지만, 실제로는 주요 역량에서 상당한 개선이 이뤄졌다. 수학적 추론 부문에서, 난이도가 높은 AIME 2025 테스트의 정확도가 70%에서 87.5%로 크게 뛰어올라 문제 해결 능력이 강화됐음을 입증했다. 이는 모델의 추론 깊이가 기존 버전의 쿼리당 약 12,000 토큰에서 23,000 토큰으로 늘어난 데서 기인한다.
수학뿐 아니라 프로그래밍 능력도 크게 향상됐다. 프로그래밍 챌린지인 Codeforces에서 모델의 점수는 약 1,530에서 1,930으로 400점 상승해, 코드 생성과 문제 해결 능력이 한층 강화됐다. 종합적인 코딩 테스트 성능 역시 크게 개선됐다.
이 같은 발전은 스탠퍼드대학교의 2025 AI 인덱스 보고서와도 맥락을 같이 한다. 해당 보고서에 따르면, 미국과 중국의 대표 AI 모델 간 주요 벤치마크 성능 격차는 2023년 두 자릿수에서 2025년 초 거의 동등한 수준까지 좁혀졌다. 챗봇 아레나 리더보드(Chatbot Arena Leaderboard)에서도 미국과 중국 모델 간 격차가 2024년 1월 9.26%에서 2025년 2월 1.70%로 급격히 줄었다.
업계 리더들도 이러한 변화를 주목하고 있다. 엔비디아(Nvidia) CEO 젠슨 황은 5월, "딥시크와 중국 알리바바의 Qwen은 세계적으로 공개된 최고의 오픈소스 AI 모델 중 하나"라며 "이들은 미국, 유럽 등지에서 빠르게 확산되고 있다"고 평가했다.
딥시크의 성과는 특히 스타트업에서 출발한 기업이라는 점에서 더욱 주목받는다. 해당 모델은 자유로운 라이선스로 공개되어 있으며, 고성능 전체 버전과 저사양 하드웨어에서도 구동 가능한 '디스틸드(distilled)' 경량 버전도 함께 제공돼 전 세계 개발자들이 첨단 AI 역량을 보다 쉽게 활용할 수 있게 됐다.