중국 스타트업 문샷 AI(Moonshot AI)가 6일 출시한 오픈소스 모델 ‘Kimi-K2-Thinking’이 글로벌 AI 커뮤니티를 뒤흔들고 있다. CNBC는 업계 관계자를 인용해 문샷의 모델 학습 비용이 460만 달러(약 67억6천만원)로, 딥시크-V3의 사전 학습 비용으로 알려진 557만 달러(약 81억8천600만원)보다 낮았다고 보도했다. 문샷은 정확한 수치를 공개하지 않았지만, 10일(현지시간) 레딧 온라인 채팅 이벤트에서 관계자는 “미국 정부의 수출 금지 이전 수입한 구형 엔비디아 H800 GPU로 학습했으며, 하이엔드 GPU 측면에서 미국 경쟁 기업보다 수적으로 열세”라며 미국 모델보다 훨씬 저렴한 비용으로 학습했다고 확인했다. 이 관계자는 ‘ppwwyyww’ 아이디를 사용했는데, 이는 우유신(Yang Zhilin) 문샷 공동 창립자가 평소 사용하는 것과 동일하다.
문샷은 기존 방식보다 최대 5배 효율적인 알고리즘인 ‘문케이크(Mooncake)’ 플랫폼 등 혁신적 기술을 개발해 컴퓨팅 파워 필요성을 줄였다고 강조했다. ‘키미 리니어 어텐션(Kimi Linear Attention)’ 아키텍처로 디코딩 속도를 높이고 메모리 사용량을 줄였다고 덧붙였다. 이렇게 제작된 Kimi-K2-Thinking은 벤치마크에서 오픈소스 최강을 기록했을 뿐 아니라 미국의 폐쇄형 모델 대부분을 뛰어넘는 성능을 보였다. 벤치마크 전문 아티피셜 애널리시스(Artificial Analysis)의 ‘지능 순위’에서 67점을 기록해 오픈AI의 GPT-5와 GPT-5 Codex(68점)를 1점차로 추격했다. 그동안 2~3위를 차지했던 최첨단 모델 그록-4(65점)와 클로드 4.5 소네트(63점)를 제친 것이다.
특히 문샷은 에이전트 성능을 극대화했다고 강조했다. 200~300단계의 연속적 도구 호출(tool use)을 자체 수행해 복잡한 계획 수립과 검색, 코드 실행 등을 인간 개입 없이 진행할 수 있다는 설명이다. 에이전트의 웹 검색 능력을 평가하는 BrowseComp와 현실 세계 정보 수집 능력을 테스트하는 Seal-0 등 벤치마크에서는 GPT-5까지 능가한 최고 점수를 기록했다. 이에 따라 모델은 며칠 새 허깅페이스에서 8만여 건의 다운로드를 기록하며 가장 인기 있는 모델로 떠올랐고, 모델을 소개한 X(트위터) 게시물은 460만 건의 조회를 기록했다. 레딧 채팅 이벤트에서도 “훌륭한 모델”이라는 칭찬이 잇달았으며, 한 사용자는 “K3는 언제 출시되나”라며 후속 모델에 대한 기대감을 드러냈다. 이에 대해 문샷 관계자는 “알트먼의 1조 달러짜리 데이터센터가 건설되기 전까지”라고 답했다.
문샷은 지난 7월 이번 전(前) 버전인 ‘Kimi-K2’를 출시해 당시에도 뛰어난 성능으로 개발자 커뮤니티의 관심을 끌었다. 그러나 이후 오픈AI의 오픈 웨이트 모델과 xAI의 그록-4 등 주요 모델이 잇달아 등장하며 바이럴에는 실패했다는 평을 받았다. 이번 K2-Thinking은 그 설욕을 하는 동시에 중국 AI 기업들의 비용 효율성이 단순한 우연이 아니라 체계적 혁신의 결과임을 입증했다. 딥시크가 보여준 저비용 고효율 접근법이 이제 산업 표준으로 자리잡고 있으며, 문샷이 이를 한 단계 더 발전시킨 것이다.
이번 사례는 AI 개발에서 하드웨어 우위가 절대적이지 않다는 점을 재확인시킨다. 미국의 칩 수출 규제 속에서도 구형 H800 GPU와 혁신적 알고리즘으로 최첨단 성능을 달성했다는 것은, AI 경쟁의 핵심이 단순한 컴퓨팅 파워가 아니라 효율적 아키텍처와 알고리즘 최적화에 있음을 보여준다. 문케이크 플랫폼의 5배 효율성 향상, 키미 리니어 어텐션의 메모리 최적화 등은 제한된 자원 내에서 최대 성능을 끌어내는 중국 AI 기업들의 전략적 강점이다. 향후 AI 경쟁은 단순한 모델 크기 경쟁에서 효율성과 실용성 중심으로 재편될 가능성이 크며, 문샷 AI는 그 선두에 서 있다.
태그: #문샷AI #KimiK2 #중국AI


