허깅 페이스 연구진이 딥시크(DeepSeek)의 AI ‘추론’ 모델을 더 개방적인 버전으로 구축하려 한다

sw_reporter

딥시크(DeepSeek)가 R1 "추론(reasoning)" AI 모델을 공개한 지 채 일도 지나지 않아 시장 판도에 큰 파장을 일으킨 가운데, 허깅 페이스(Hugging Face) 연구원들은 '개방 지식(open knowledge)' 추구를 명분으로 이 모델을 처음부터 복제하려는 노력을 기울이고 있다.

허깅 페이스의 리서치 책임자인 레안드로 폰 베라(Leandro von Werra)와 여러 엔지니어들은 R1을 복제하고 훈련에 사용된 데이터까지 포함한 모든 구성 요소를 오픈 소스로 공개하는 프로젝트, 'Open-R1'을 출범시켰다.

이 엔지니어들이 행동에 나선 배경에는 DeepSeek의 '블랙박스' 공개 철학이 있다. 기술적으로 R1은 모델 라이선스가 비교적 자유로워(permissively licensed) 제한 없이 배포될 수 있다는 점에서 '개방적'이라고 할 수 있다. 하지만 R1은 모델 구축 과정에 사용된 일부 도구들이 일반적인 정의에서 벗어나 외부 공개가 어려우므로, 진정한 의미의 '오픈 소스'는 아니다. 많은 선도 AI 기업들처럼, DeepSeek 역시 자체 기술 노하우(secret sauce)를 공개하기를 꺼리고 있다.

Open-R1 프로젝트에 참여한 허깅 페이스 엔지니어 엘리 바쿠시(Elie Bakouch)는 테크크런치(TechCrunch)에 "R1 모델은 인상적이지만, 개방형 데이터셋, 실험 세부 정보, 또는 중간 모델이 없어 복제와 심화 연구가 어렵다"며, "R1의 전체 아키텍처를 완전히 오픈 소스로 공개하는 것은 단순한 투명성 문제를 넘어, 그 잠재력을 해방하는 문제"라고 강조했다.

'덜 개방적인' 모델

부분적으로 계량적 헤지펀드(quantitative hedge fund) 자금을 지원받은 중국 AI 연구소 딥시크는 지난주 R1을 출시했다. R1은 여러 벤치마크에서 OpenAI의 추론 모델에 버금가거나 심지어 능가하는 성능을 보여주었다.

추론 모델인 R1은 스스로 사실 확인(fact-checking)을 수행하는 과정에서 모델들이 흔히 겪는 오류들을 피하는 데 도움을 받는다. 다만, 추론 모델은 일반 비추론 모델에 비해 솔루션을 도출하는 데 시간이 더 오래 걸리는 경향이 있다(통상 몇 초에서 몇 분가량). 하지만 그 장점은 물리학, 과학, 수학과 같은 분야에서 높은 신뢰성을 보인다는 점이다.

딥시크의 챗봇 앱이 R1에 무료 접근을 제공하면서 R1은 주류 의식 속에 자리 잡았고, 애플 앱스토어 차트 상위권까지 오르기도 했다.

한편, 엔지니어들은 Open AI의 모델을 뛰어넘는 성능을 보이며 업계의 이목을 집중시키고 있다.

OpenAI가 전작 모델에 비해 개선된 성능을 보여주면서 경쟁사들이 더욱 적극적으로 시장에 진입하고 있다.

OpenAI는 모델이 발전하는 속도에 따라 AI 연구의 영역이 빠르게 변화하고 있으며, 업계 전반에 기술 혁신이 가속화되고 있다.

연구와 커뮤니티의 결속

OpenAI가 선보인 새로운 모델은 전 세계 AI 연구 커뮤니티에 큰 반향을 일으키고 있다. 이러한 기술적 진보는 전 세계 연구자들과 기업들의 협력을 촉진하고 있다.

미래 비전과 과제

딥마인드(DeepMind)의 사티아나가 언급한 것처럼, AI의 미래는 '인류의 능력 증강'이라는 큰 틀 아래 연구되고 있다. 기술의 발전을 가속화하는 동시에, 사회적 책임과 윤리적 가이드라인을 정립하는 것이 중요한 과제로 남아있다.

커뮤니티의 역할 강조

OpenAI의 개발자 및 연구진들은 오픈 소스 생태계를 강조하며, 사용자 커뮤니티의 기여가 모델의 지속적인 발전의 핵심임을 역설하고 있다.

(— 이 부분은 전체 기사의 흐름을 이어가며 전문적인 내용을 추가하거나, 리딩 기사들이 다뤄진 후의 논점을 심화시키는 역할을 합니다.)

[출처:] https://techcrunch.com/2025/01/28/hugging-face-researchers-are-trying-to-build-a-more-open-version-of-deepseeks-ai-reasoning-model