
Anthropic은 세 중국 AI 기업이 자체 모델 개선을 목적으로 자사의 Claude AI 모델을 활용해 24,000개 이상의 가짜 계정을 만들었다고 비난하고 나섰습니다.
딥시크(DeepSeek), 문샷 AI(Moonshot AI), 미니맥스(MiniMax) 이 세 연구소는 이 계정들을 통해 "지식 증류(distillation)"라는 기법을 사용하여 1,600만 건 이상의 상호 작용을 생성한 것으로 알려졌습니다. Anthropic에 따르면, 이들 연구소는 "Claude의 가장 차별화된 기능인 에이전트 추론(agentic reasoning), 도구 사용(tool use), 코딩"을 노렸다고 밝혔습니다.
이러한 비난은 중국의 AI 개발을 억제하기 위한 수출 통제 정책, 특히 첨단 AI 칩에 대한 통제 규정을 얼마나 엄격히 적용할지에 대한 논쟁이 뜨거운 가운데 나왔습니다.
지식 증류는 AI 연구소들이 자체 모델의 크기를 줄이고 비용을 절감하기 위해 사용하는 일반적인 훈련 방법입니다. 그러나 경쟁사들이 이를 악용해 마치 다른 연구소의 과제를 훔쳐내는 방식으로 활용할 수 있습니다. 실제로 OpenAI는 이달 초 의원들에게 보낸 메모에서 딥시크가 증류를 이용해 자사 제품을 모방했다고 비난한 바 있습니다.
딥시크는 1년 전, 미국 최첨단 연구소와 거의 유사한 성능을 훨씬 낮은 비용으로 구현한 오픈 소스 R1 추론 모델을 공개하며 큰 주목을 받았습니다. 딥시크는 곧 최신 모델인 DeepSeek V4를 출시할 예정이며, 이 모델은 코딩 영역에서 Anthropic의 Claude와 OpenAI의 ChatGPT를 능가할 수 있을 것으로 보고되고 있습니다.
공격의 규모는 그 범위가 각기 달랐습니다. Anthropic이 추적한 바에 따르면, 딥시크는 기반 논리 및 정렬(foundational logic and alignment) 개선을 목표로 하는 15만 건 이상의 상호 작용을 보여주었으며, 특히 정책에 민감한 질문을 우회할 수 있는 대안에 중점을 두었습니다.
문샷 AI의 경우, 에이전트 추론, 도구 사용, 코딩 및 데이터 분석, 컴퓨터 사용 에이전트 개발, 컴퓨터 비전 등과 관련된 340만 건이 넘는 상호 작용이 있었습니다. 지난달 이 회사는 새로운 오픈 소스 모델인 Kimi K2.5와 코딩 에이전트를 출시했습니다.
미니맥스의 1,300만 건의 상호 작용은 에이전트 코딩, 도구 사용, 오케스트레이션(orchestration)을 목표로 했습니다. Anthropic은 특히 미니맥스가 최신 Claude 모델이 출시되자마자 트래픽의 거의 절반을 우회하여(siphon) 역량을 흡수하려던 모습을 관찰했다고 전했습니다.
Anthropic은 지식 증류 공격을 실행하기 어렵게 만들고 식별하기 쉽게 만드는 방어 기술에 계속 투자할 것이라면서도, "AI 업계, 클라우드 제공업체, 정책 입안자들의 협력적 대응"을 촉구하고 있습니다.
이러한 증류 공격은 미국산 칩의 중국 수출 문제에 대한 논쟁이 여전히 뜨거운 시점에 제기되었습니다. 지난달 트럼프 행정부는 엔비디아(Nvidia)와 같은 미국 기업들이 첨단 AI 칩(예: H200)을 중국에 수출하는 것을 공식적으로 허용했습니다. 비평가들은 이러한 통제 완화 조치가 글로벌 AI 패권 경쟁이 격화된 중요한 시점에 중국의 AI 컴퓨팅 역량을 크게 증대시킬 것이라고 지적해왔습니다.
Anthropic은 딥시크, 미니맥스, 문샷이 수행한 추출 규모는 "첨단 칩에 대한 접근성이 필수적"이라고 지적했습니다.
실버라도 정책 가속기(Silverado Policy Accelerator) 회장이자 크라우드스트라이크(CrowdStrike)의 공동 창립자이자 전 CTO인 Anthropic의 관계자는 TechCrunch과의 인터뷰에서 "따라서 증류 공격은 수출 통제 논리를 강화합니다. 칩 접근이 제한되면 직접적인 모델 훈련과 불법적인 증류 규모 모두가 제한되기 때문입니다"라며, 이러한 공격을 접하는 것이 놀랍지 않다고 밝혔습니다.
이 관계자는 "미국 최첨단 모델을 증류하는 방식으로 훔치는 것이 중국 AI 모델의 빠른 발전 이유 중 일부였다는 사실은 이미 오래전부터 분명했습니다. 이제 우리는 이를 사실로 확인했습니다. 이는 이들 기업 중 어느 곳에도 AI 칩을 판매를 거부해야 할 더욱 강력한 이유를 제공해야 합니다. 왜냐하면 이는 그들에게 추가적인 이점만을 줄 뿐이기 때문입니다"라고 덧붙였습니다.
Anthropic은 또한 지식 증류가 미국 AI의 우위를 저해하는 것뿐만 아니라 국가 안보 위험까지 초래할 수 있다고 강조했습니다.
Anthropic의 블로그 게시물에는 "앤트로픽과 다른 미국 기업들은 국가 및 비국가 행위자가 AI를 이용하여 생물무기 개발이나 악의적인 사이버 활동을 하는 것을 막는 시스템을 구축하고 있다"고 명시되어 있습니다. 이어 "불법 증류 과정을 거쳐 만들어진 모델은 이러한 안전장치를 유지하기 어려우며, 많은 보호 장치들이 완전히 제거되면서 위험한 역량들이 확산될 수 있다"고 경고했습니다.
Anthropic은 권위주의 정부가 "공격적인 사이버 작전, 허위 정보 캠페인, 대규모 감시" 등 목적으로 최첨단 AI를 배치하는 사례를 언급하며, 이러한 모델이 오픈 소스화될 경우 위험성이 더욱 증폭될 수 있다고 지적했습니다.
테크크런치(TechCrunch)는 딥시크, 미니맥스, 문샷에 논평을 요청했습니다.
본 기사는 드미트리 알페로비치(Dmitri Alperovitch)가 과거 크라우드스트라이크(Crowdstrike)의 최고 기술 책임자(CTO)였다는 점을 명확히 하기 위해 수정되었습니다.