• 디프시크(DeepSeek), 중국 네이티브 칩 및 엔비디아 CUDA를 대체할 CANN 지원 AI 모델 데뷔... 화웨이, 캠브리콘, 하이곤 등 중국 칩 제조사 최상급 지원 확보

    중국 기업들은 빠르게 대응했다.

    article image

    중국 AI 기업 딥시크(DeepSeek)가 화웨이(Huawei)의 아센드(Ascend) 하드웨어 및 CANN 소프트웨어 스택에 최적화된 최신 거대 언어 모델(LLM) DeepSeek-V3.2-Exp를 출시했습니다. 이번 출시는 핵심 모델 운영의 우선순위가 엔비디아(Nvidia)의 CUDA 생태계에 의존하기보다는 국내 가속기(accelerator)에서 구동되도록 이동했음을 보여주는 중요한 신호탄입니다.

    딥시크는 9월 29일 해당 모델을 발표하며, 코드와 체크포인트를 허깅 페이스(Hugging Face)에 공유하고 기술 보고서도 함께 공개했습니다. 딥시크는 V3.2-Exp를 "차세대 아키텍처로 나아가기 위한 중간 단계"로 설명하며, 특히 긴 컨텍스트 추론(long-context inference) 과정의 비용 절감을 목표로 개발했다고 밝혔습니다. 이 모델은 출력 품질을 유지하면서 메모리 및 컴퓨팅 요구 사항을 절감하는 희소 어텐션 메커니즘(sparse attention mechanism)을 특징으로 합니다.

    화웨이의 아센드 팀과 vLLM-Ascend 커뮤니티는 DeepSeek-V3.2-Exp의 통합을 위해 신속하게 움직였습니다. vLLM-Ascend 저장소에는 V3.2-Exp 지원을 위해 아센드 NPU(신경 처리 장치)에 필요한 사용자 정의 연산자(custom operator) 설치 단계 및 커널 패키징 방법을 담은 새로운 이슈가 등록되었습니다. CANN 팀 역시 추론 레시피를 공개하며, 해당 모델이 화웨이 하드웨어 전반에 걸쳐 즉시 배포될 수 있도록 체계를 갖추었습니다.

    이와 동시에, 엔비디아가 자사 칩의 시장 공급에 어려움을 겪자 중국의 국산 실리콘 공급업체들이 주목받고 있습니다. 중국 기업들 사이에서는 블랙마켓을 통해 H200 칩을 조달하는 방안을 검토한다는 보도도 나왔습니다.

    다른 중국 칩 제조업체들도 합류하며 경쟁에 불을 붙였습니다. 그중 캠브리콘(Cambricon)은 자체 vLLM-MLU 포크에 V3.2-Exp 호환성 업데이트를 배포하며, 자사의 추론 엔진과 모델의 희소 어텐션 조합이 장문 시퀀스 처리 비용을 획기적으로 절감한다고 주장했습니다. 하이곤(Hygon) 역시 자사의 DCU 가속기가 DTK 소프트웨어 스택을 통해 "제로 대기(zero-wait)" 배포를 할 수 있도록 최적화되었다고 발표했습니다.

    딥시크는 아센드/CANN 팀과 협력을 강화하며, vLLM 및 SGLang + TileLang 지원 등 Cann 관련 Git 코드 및 GitHub 업데이트를 지속적으로 진행하고 있습니다. 캠브리콘 또한 자체 추론을 지원하기 위해 vLLM(vLLM-MLU) 업데이트를 완료했습니다.

    한편, SGLang은 Ascend를 포함한 여러 백엔드에서 V3.2-Exp 지원을 확인했으며, 딥시크의 GitHub 기록은 출시 단계부터 vLLM과의 호환성을 시사합니다. 주목할 점은 딥시크가 자체 발표에서 TileLang과 CUDA 커널을 모두 언급하며 연구원들에게 프로토타이핑 시 TileLang 사용을 권장하고 있다는 부분입니다. 이는 사실상 동일한 모델 아티팩트를 최소한의 그래프 변경만을 거쳐 엔비디아와 중국 가속기 양쪽 모두에 배포할 수 있음을 의미합니다.

    이러한 빠른 기술 채택 속도는 중국의 AI 생태계가 엔비디아 하드웨어 접근성을 더 이상 당연하게 여길 수 없는 미래를 향해 강력하게 준비하고 있음을 명확히 보여줍니다. 엔비디아의 CUDA가 여전히 학습 및 추론 모두에서 지배적이지만, 딥시크의 이번 최신 발표는 주요 중국 기업이 비(非) CUDA 스택에 최적화된 모델을 최초로 공개한 사례 중 하나라는 점에서 의미가 큽니다.

    아센드, 캠브리콘, 하이곤 등 주요 기업에 걸친 이 조정된 노력은 중국 기업들이 AI 주권(AI sovereignty)에 대한 베이징 정부의 요구를 단순한 사후 호환성 확보를 넘어, 자국 플랫폼을 최고 수준의 목표 지점으로 삼아 진지하게 접근하고 있음을 보여주는 가장 확실한 증거입니다.

    최신 뉴스, 분석 및 리뷰를 받아보시려면 Tom's Hardware를 구글 뉴스(Google News)에서 팔로우해 주십시오.

    [출처:] https://www.tomshardware.com/tech-industry/deepseek-new-model-supports-huawei-cann