딥시크(DeepSeek), R1 추론 AI 모델 업데이트 및 허깅 페이스 공개

sw_reporter

중국 스타트업 딥시크(DeepSeek)가 수요일 오전 위챗 메시지를 통해 발표한 후, 자사의 R1 추론 AI 모델 업데이트 버전을 개발자 플랫폼 허깅 페이스(Hugging Face)에 공개했습니다. 딥시크의 위챗 공지에 따르면, 상업적 사용이 가능한 관대한 MIT 라이선스가 적용된 업데이트된 R1은 '사소한(minor)' 업그레이드입니다. 허깅 페이스 리포지토리에는 모델에 대한 설명 대신, 모델의 동작을 안내하는 내부 구성 요소인 설정 파일과 가중치(weights)만 포함되어 있습니다. 크기가 6,850억 개의 파라미터(parameters)에 달하는 이 업데이트된 R1은 상당히 큰 규모입니다. ("파라미터"는 "가중치(weights)"와 동의어입니다.) 이 모델은 수정 없이 일반 소비자급 하드웨어에서는 작동하기 어려울 것으로 보입니다. 딥시크는 올해 초 R1을 출시한 이후 주목받기 시작했으며, 당시 R1은 OpenAI의 모델들과 어깨를 나란히 할 만큼 성능을 자랑했습니다. 이 스타트업은 딥시크의 기술이 국가 안보 위험을 초래한다고 주장하는 미국의 일부 규제 기관들로부터 반발을 사기도 했습니다.

중국 스타트업 딥시크(DeepSeek)가 수요일 오전에 위챗 메시지를 통해 발표한 후, 자사의 R1 추론 AI 모델 업데이트 버전을 개발자 플랫폼 허깅페이스(Hugging Face)에 공개했습니다.

딥시크의 위챗 공지에 따르면, 상업적 이용이 가능한 허용적 MIT 라이선스(permissive MIT license)가 적용된 이번 R1은 '경미한(minor)' 업그레이드라고 합니다. 허깅페이스 리포지토리에는 모델 설명서가 포함되어 있지 않으며, 모델의 동작을 안내하는 내부 구성 요소인 구성 파일과 가중치만을 담고 있습니다.

6,850억 개의 매개변수(parameters) 규모인 이번 업데이트된 R1은 매우 큰 용량을 자랑합니다. (여기서 ‘매개변수’는 ‘가중치’와 동의어입니다.) 이 모델은 구조 변경 없이 소비자용 하드웨어에서 구동하기 어려울 것으로 예상됩니다.

딥시크는 올해 초 R1을 출시한 이후 주목받기 시작했으며, 이 모델은 OpenAI의 모델들과 비교해도 손색없는 수준을 보여주었습니다. 이로 인해 스타트업은 미국 내 일부 규제 기관들로부터 비판을 받고 있으며, 이들은 딥시크의 기술이 국가 안보에 위협이 된다고 주장하고 있습니다.

[출처:] https://techcrunch.com/2025/05/28/deepseek-updates-its-r1-reasoning-ai-model-releases-it-on-hugging-face