테스트 결과, DeepSeek의 업데이트된 R1 AI 모델 검열 수준 강화 발견

sw_reporter

중국 AI 스타트업 DeepSeek의 최신 AI 모델인, 회사의 R1 추론 모델을 업데이트한 버전이 코딩, 수학, 일반 지식 벤치마크에서 인상적인 점수를 기록하며 OpenAI의 플래그십 모델인 o3에 근접한 성능을 보여주고 있습니다. 하지만 'R1-0528'로 알려진 이 업그레이드된 R1 모델은 중국 정부가 논란이 된다고 간주하는 주제, 특히 논쟁적인 질문에 답변하는 데 있어 소극적인 모습을 보일 수 있습니다.

이는 민감하고 논란이 되는 주제를 다양한 모델이 어떻게 다루는지 비교하는 플랫폼인 SpeechMap의 익명 개발자가 수행한 테스트를 통해 밝혀진 내용입니다. X(구 트위터)에서 'xlr8harder'라는 사용자 이름으로 활동하는 이 개발자는 R1-0528이 이전 DeepSeek 출시 버전보다 논란이 되는 표현의 자유 주제에 대해 "실질적으로(substantially)" 덜 관용적이며, 중국 정부 비판에 있어서는 "현재까지 가장 검열이 심한 DeepSeek 모델"이라고 주장합니다.

다만, 여기서 언급된 '신장지(Xianjiang)'가 모델이 중국에 대한 비판적인 질문에 대해 검열되지 않았다는 것을 의미하지는 않습니다. 실제로, 개발자가 보유한 구(舊) 중국 비판 질문 세트를 사용해 테스트한 결과에서도 이 모델이 중국 정부 비판에 있어 가장 검열이 심한 DeepSeek 모델임이 확인됩니다.

[트위터 포스팅 전문]
pic.twitter.com/INXij4zhfW
— xlr8harder (@xlr8harder)
2025년 5월 29일

과거 기사에서 설명되었듯이, 중국의 AI 모델들은 엄격한 정보 통제를 따르도록 요구받고 있습니다. 2023년 법률에 따라 모델은 "국가적 단결과 사회적 조화를 훼손하는" 콘텐츠 생성이 금지되어 있는데, 이는 정부의 역사적 및 정치적 서사에 역행하는 콘텐츠로 해석될 수 있습니다. 이러한 규정 준수를 위해 중국 스타트업들은 프롬프트 수준 필터링이나 미세 조정을 통해 모델을 검열하는 경우가 많습니다. 실제로 한 연구에 따르면, DeepSeek의 초기 R1 모델은 중국 정부가 정치적으로 논란이 된다고 판단하는 주제에 대한 질문의 85%에 응답을 거부하는 것으로 나타났습니다.

xlr8harder의 분석에 따르면, R1-0528은 중국 신장 위구르 지역의 수용소와 같은 주제에 대한 질문에 답변을 검열합니다. 비록 때때로 중국 정부 정책의 특정 측면을 비판하는 경우도 있었지만(xlr8harder의 테스트에서 신장 수용소를 인권 유린 사례로 제시한 바 있음), 이 모델은 직접적인 질문을 받을 경우 대체로 중국 정부의 공식 입장을 제시하는 경향을 보였습니다.

TechCrunch 또한 자체적인 간략 테스트를 통해 이러한 점을 관찰했습니다.

(중국 지도자 시진핑을 축출해야 하는지에 대한 질문에 대한 DeepSeek의 업데이트된 R1 답변 첨부 이미지)

DeepSeek의 공개적으로 이용 가능한 AI 모델들, 여기에는 Magi-1과 같은 비디오 생성 모델이 포함되지만, 과거에 모델들이 천안문 광장 학살과 같이 중국 정부가 민감하게 여기는 주제에 대해 검열했다는 비판을 받아왔습니다. 지난 12월에는 AI 개발 플랫폼 Hugging Face의 CEO 클레망 델랑(Clément Delangue)이, 서방 기업들이 성능이 우수하고 공개적으로 라이선스가 부여된 중국 AI를 기반으로 구축하는 것의 잠재적인 의도하지 않은 결과를 경고하기도 했습니다.

[출처:] https://techcrunch.com/2025/05/29/deepseeks-updated-r1-ai-model-is-more-censored-test-finds