자오신(Zhaoxin)은 자사의 64코어 서버 CPU만으로 DeepSeek의 671B 모델을 GPU의 도움 없이 구동할 수 있다고 주장했다.

DeepSeek의 중국 소비자 시장 진출이 가속화되고 있으며, Zhaoxin은 자사 하드웨어 라인업 전체에 DeepSeek-R1 LLM을 탑재했다고 발표했습니다. x86 명령어 세트 사용 권한을 가진 몇 안 되는 중국 기업 중 하나인 Zhaoxin은 자사의 프로세서와 OEM 시스템이 DeepSeek이 지금까지 공개한 1.5B, 7B, 14B, 32B, 70B, 671B 매개변수(parameter) 모델을 네이티브로 구동할 수 있다고 강조했습니다.
Zhaoxin의 보도 자료는 특히 소비자용 프로세서인 KaiXian KX-7000/8과 서버용 프로세서인 Kaisheng KH-40000/32 64코어 모델에 초점을 맞추고 있습니다. KX-7000/8은 3.7GHz로 작동하는 8코어 모델이며 L3 캐시는 32MB입니다. Zhaoxin에 따르면, 이 칩은 이름이 언급되지 않은 중국산 GPU와 결합했을 때 DeepSeek-R1-7B 모델을 네이티브로 실행할 수 있습니다. 또한 워드 프로세서 및 VSCode 인터페이스와의 통합을 통해 AI 기반 글쓰기, 스프레드시트 작업, 프로그래밍이 지원됩니다.
이 과정에서 언급된 AI 가속기 카드는 해당 AI 성능의 주요 동력원임이 분명합니다. 최근 테스트 결과에 따르면, KX-7000/8은 7년 된 Intel i3-8100 쿼드코어 칩과 비교했을 때 멀티코어 벤치마크에서는 우위를 점했지만, 싱글코어 작업 부하에서는 큰 차이를 보였습니다. CPU-Z 싱글코어 결과는 i3-8100의 422.2점에 비해 335.9점을 기록했습니다.
Nvidia의 칩 공급난 속 중국 현지 실리콘 공급업체가 주목받다
Zhaoxin의 엔터프라이즈급 KH-40000 제품군 또한 집중적으로 소개되었으며, KH-40000/16 및 /32 칩이 AI 성능 테스트를 거쳤습니다. OEM AI 워크스테이션의 일부로, KH-40000/16은 Deepseek-R1의 32B 모델까지 성공적으로 구동했습니다. 완전히 중국산 서버인 Lianhe Donghai XRS302 서버 워크스테이션에는 16코어, 2.2GHz 서버 프로세서의 성능을 보조하기 위해 네 개의 중국산 AI 가속기 추가 카드가 장착되었습니다. 다만, Donghai XRS302가 완성형으로 출하되지 않아 테스트에 사용된 GPU나 RAM 등의 세부 사양은 알 수 없습니다.
마지막으로, 듀얼 CPU 서버에 적합하도록 설계된 Zhaoxin의 플래그십 KH-40000/32는 Deepseek의 70B 모델을 배포했으며, GPU 없이도 671B 모델을 구동하는 데 성공했습니다. (이 주장은 뉘앙스가 일부 누락된 부분입니다. 70B 모델은 상대적으로 수월한 구동을 보였던 반면, 671B 모델은 작동에 어려움이 있어 간신히 구동한 것으로 해석됩니다.)
Zhaoxin이 제시한 주장의 객관적인 판단은 언어 장벽과 더불어 LLM 성능에 대한 회사의 매개변수가 스크린샷 외에는 매우 모호하여 어렵습니다. DeepSeek-R1이 Zhaoxin CPU에서 작동하는 것이 DeepSeek의 소프트웨어 성공을 증명하는 것인지, 아니면 Zhaoxin 하드웨어의 역량을 보여주는 것인지는 두고 지켜봐야 할 문제입니다.
DeepSeek은 중국 기술 시장에 지속적인 활력을 불어넣고 있으며, 더 많은 하드웨어 회사들이 제품 통합을 서두르고 있습니다. 심지어 스마트 TV까지 최근 DeepSeek 통합을 적용했습니다. Nvidia와 OpenAI의 주가를 크게 끌어내렸던 DeepSeek과 중국 하드웨어 산업 전반은 향후 몇 주 동안 모멘텀을 유지하며 중국 기술 부문의 역량을 입증하려 할 가능성이 높습니다.