AI 혁신 주도 기업 DeepSeek의 차세대 모델 개발, 중국의 엔비디아 GPU 수출 제한으로 지연... AI GPU 부족이 개발에 차질 줘

hw_reporter

하드웨어도, AI도?

더 인포메이션(The Information)에 따르면, DeepSeek은 연초 R1 AI 모델을 통해 큰 관심을 받았으나, 차세대 R2 모델 개발이 중국의 엔비디아 H20 프로세서 부족 사태로 인해 중단된 것으로 알려졌다. DeepSeek 측은 R2 모델의 구체적인 출시 시점에 대해서는 아직 언급하지 않았다.

DeepSeek은 투자사 하이플라이어 캐피탈 매니지먼트(High-Flyer Capital Management)를 통해 확보한 호퍼 GPU 클러스터 50,000개(H20 30,000개, H800 10,000개, H100 10,000개 포함)를 활용하여 R1 모델을 훈련했다. R2 모델이 이미 완전히 사전 학습을 마쳤는지 여부는 불분명하다. 더 인포메이션이 해당 프로젝트에 정통한 두 관계자를 인용 보도에 따르면, DeepSeek 팀은 현재 모델 개발에 집중하고 있지만, 량원펑(Liang Wenfeng) CEO는 아직 모델의 역량에 만족하지 못했다고 한다. 따라서 배포를 앞두고 성능 개선을 위한 내부 작업이 계속 진행 중인 것으로 전해졌다.

R1 모델은 민간 스타트업부터 대기업, 정부 관련 기관에 이르기까지 다양한 사용자들로부터 빠르고 광범위하게 채택되었다. 이 사용자들 대부분은 엔비디아 H20 프로세서로 모델을 구동해왔다. 더 인포메이션에 따르면, H20의 선적 제한이 이미 문제를 야기하고 있으며, 이는 R1의 현장 사용을 제한할 뿐만 아니라 R2 출시 준비에도 어려움을 가중시키고 있다.

엔비디아의 시장 공급 차질로 중국의 자체 실리콘 공급업체 주목

더 인포메이션이 인용한 관계자들은 DeepSeek의 차기 R2 모델이 현재 사용 가능한 오픈소스 대안 모델들의 역량을 뛰어넘을 경우, 그 사용량이 중국 클라우드 플랫폼의 수용 능력을 초과하여 급증할 것으로 예상한다고 밝혔다. 이전 R1 모델에 의존하는 대부분의 조직들이 현재 공급난을 겪고 있는 엔비디아 H20 프로세서로 시스템을 운영 중인 실정이다.

미국 정부는 지난 4월 중순부터 AI 학습 및 추론을 목적으로 하는 엔비디아 H20 프로세서의 판매를 제한했다. 비록 이 칩이 인기 제품인 H100 GPU의 성능을 크게 낮춘 버전이지만, 중국 AI 기업들이 엔비디아의 CUDA 소프트웨어 스택에 강하게 의존하고 있기 때문에, H20은 중화인민공화국 내에서 매우 인기 있는 제품이었다. 그 결과 엔비디아는 매 분기 수십억 달러 규모에 달하는 H20 프로세서를 판매해 왔다.

DeepSeek의 AI 소프트웨어는 엔비디아 하드웨어에 최적화되어 있어, 이 기업이 미국 정책 결정에 특히 취약한 구조를 가지고 있다는 지적이다. DeepSeek이 OpenAI와 같은 미국 기업보다 훨씬 적은 자원으로 모델을 개발했다고 주장함에도 불구하고, 최근의 수출 통제는 근본적인 약점을 드러낸다. 즉, 중국의 최고 AI 기업들이 여전히 미국 하드웨어에 크게 의존하고 있다는 점이다. 한편, OpenAI는 공식적으로 문제를 제기한 바는 없으나, R1 개발 과정에서 DeepSeek이 자사 독점 모델을 사용했다는 의혹을 비공식적으로 제기한 바 있다.

최신 뉴스, 분석 및 리뷰는 Tom's Hardware를 Google News에서 팔로우하여 피드에서 받아보세요. 팔로우 버튼을 클릭해 주세요.

[출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-disruptor-deepseeks-next-gen-model-delayed-by-nvidia-h20-restrictions-short-supply-of-accelerators-hinders-development