DeepSeek이 화웨이의 Ascend 칩에서 성공적인 훈련을 진행하지 못했다는 보도

새 보고서에 따르면, DeepSeek은 Nvidia 하드웨어에서 R1 모델 훈련에 성공한 후, 차기 모델에 사용되는 하드웨어로 Huawei Ascend 기반 플랫폼으로 전환하라는 중국 당국의 요청을 받았다고 합니다. 하지만 파이낸셜 타임스(Financial Times) 보도에 따르면, R2 모델 훈련 과정은 지속적인 Huawei 하드웨어 오류에 직면하면서 지연되었으며, 결과적으로 DeepSeek은 훈련 단계에는 Nvidia 칩을, 추론 단계에는 Huawei 칩을 사용하는 형태로 전전긍긍했다고 합니다.
FT가 인용한 사안을 아는 관계자 세 명에 의하면, 중국 당국은 R1 성공 이후 DeepSeek에게 훈련 시 Nvidia 대신 Huawei의 Ascend 기반 플랫폼을 활용할 것을 권장했습니다. 이에 DeepSeek은 R2 개발 과정에서 이 조언을 따랐으나, 불안정한 성능, 느린 칩 간 연결성, 그리고 Huawei의 CANN 소프트웨어 툴킷 제한 사항 등 여러 문제점에 빠르게 봉착했습니다.
결국 DeepSeek은 R2 모델 훈련을 위해 Nvidia AI 가속기로 회귀했으며, 추론 단계는 Huawei 하드웨어를 유지했습니다. 이러한 혼합 접근 방식은 선호라기보다는 불가피한 필요에 의한 타협이었지만, 다른 한편으로는 중국 내 Nvidia 프로세서 공급 부족을 감안할 때, DeepSeek의 많은 고객들이 이러한 플랫폼에서 R2를 사용할 예정이므로, 새로운 AI 모델이 Huawei 하드웨어에서 작동하도록 보장하는 것이 전략적으로 합리적입니다.
중국 현지 실리콘 공급업체들, Nvidia의 칩 시장 공급 어려움 속 주목받다
Nvidia, 중국군의 미국 기술 의존도를 '비합리적'이라 경고
베이징, H200 구매를 '특별한 사유'가 있는 이들에게 제한한다는 보도
Huawei는 DeepSeek의 데이터센터로 엔지니어 팀을 파견하여 훈련 문제를 해결하려 노력한 것으로 알려졌습니다. 하지만 이들의 현장 배치에도 불구하고, 회사는 Ascend 플랫폼에서 완전하게 성공적인 훈련을 완료한 적이 없다고 전해집니다. 현재까지도 새로운 모델이 추론 목적으로 Ascend와 호환될 수 있도록 하는 노력이 지속되고 있습니다.
프로젝트 관계자에 따르면, Ascend에서 훈련을 완료하지 못한 점이 R2 출시가 계획했던 5월 일정에서 지연된 주된 원인이었습니다. 다만, 이전 보고서에 따르면 중국 내 고성능 Nvidia GPU 부족 또한 R2 일정에 영향을 미친 바 있습니다. 현재 R2가 이미 완전히 사전 훈련되었는지 여부는 확인되지 않았습니다.
DeepSeek은 투자사 High-Flyer Capital Management를 통해 공급받은, HGX H20 유닛 3만 개, H800 1만 개, H100 1만 개로 구성된 총 5만 개 규모의 Hopper 시리즈 GPU 클러스터를 활용하여 R1 모델을 훈련한 것으로 알려졌습니다. R2는 본질적으로 훈련에 훨씬 강력한 클러스터를 요구하므로, DeepSeek과 그 후원사는 이들을 배치할 장소를 확보해야 할 것입니다(중국 내 충분한 AI 데이터센터 덕분에 난관이 아닐 수도 있습니다). 그러나 또 다른 문제가 있습니다. 보고서에 따르면 DeepSeek의 AI 플랫폼은 Nvidia 하드웨어에 특화되어 있어, 회사 자체를 Nvidia GPU 가용성에 취약하게 만들 뿐만 아니라 고객들로 하여금 Nvidia의 HGX H20 같은 AI 가속기 공급에 의존하게 만듭니다. 따라서 DeepSeek에게는 R2의 추론이 Huawei Ascend와 같은 국내 하드웨어 플랫폼에서 작동하도록 구현하는 것이 매우 중요한 과제입니다.
최신 뉴스, 분석 및 리뷰를 피드에서 받으려면 구글 뉴스에서 Tom's Hardware를 팔로우하세요. 팔로우 버튼을 클릭하는 것을 잊지 마십시오.