메모리가 적다면, 규제 기관과의 문제도 줄어들까요?

로이터 통신에 따르면, 엔비디아는 미국 관리들이 개정된 수출 규정을 통해 원래 버전을 사실상 제한함에 따라 중국 시장 접근성을 유지하기 위해 7월경 HGX H20 AI 프로세서의 다운그레이드 버전을 중국에 도입할 계획이다. 초기 정보에 따르면, 이번 개정된 AI GPU는 신규 기술 제한을 준수하기 위해 온보드 HBM 메모리 용량을 축소했으며, 이는 기존에 승인된 모델을 대체하는 형태가 될 예정이다.
로이터 통신 소식통에 따르면, 이번 신규 AI GPU의 변경 사항 중 하나는 메모리 용량 축소인데, 이는 프로세서가 수백억 개에 달하는 매개변수를 가진 대규모 언어 모델을 훈련시키는 능력을 저해할 수 있다고 지적했다. 다만, 최종 성능 특성은 최종 고객이 HGX GPU 모듈을 구성하는 방식에 따라 조정될 여지가 있어, 전반적인 성능 저하에도 불구하고 어느 정도의 유연성을 확보할 가능성은 있습니다.
앞서 미국 당국은 미공개 수출 규정으로 인해 지난 4월 AMD의 Instinct MI308, 엔비디아의 HGX 20을 포함한 일부 AI 프로세서의 대중국(홍콩 및 마카오 포함) 판매를 제한했다. 그 결과, AMD와 엔비디아는 대중국 행 물품에 대한 수출 허가 심사가 거부될 가능성을 전제로 수십억 달러에 달하는 재고(엔비디아 55억 달러, AMD 8억 달러)를 상각해야 하는 상황에 놓였다.
그러나 엔비디아는 이 중요한 시장에 대한 접근성을 유지하기 위해, 미국 정부가 설정한 허용 임계치 내에 머무르도록 일련의 성능 강하 조치(downgrades)를 통합하고 있다. 엔비디아는 이미 중국 클라우드 컴퓨팅 분야의 주요 고객사들에게 이러한 계획을 전달한 것으로 알려졌다.
만약 다운그레이드된 HGX H20 프로세스에 대한 정보가 사실이라면, 이는 축소된 H100 실리콘을 기반으로 하는 엔비디아의 중국 전용 호퍼(Hopper) 기반 GPU로는 세 번째 사례가 된다. 주목할 만한 점은 중국용 블랙웰(Blackwell) 기반 AI 제품에 대한 언급은 아직 없다는 것이다.
한편, 미국 정부가 2022년 중국으로 수출되는 AI 및 HPC GPU에 대해 첫 번째 제한 조치를 부과한 이후, 엔비디아는 네트워킹 기능이 축소된 H800 프로세서를 개발했다. H800은 원래의 H100 대비 성능 저하가 비교적 미미했다. 이후 미국 행정부가 중국으로 출하되는 프로세서의 성능을 제한하는 새로운 수출 규정을 발표하자, 엔비디아는 AI 학습용으로 H100 기반의 HGX H20과 AI 추론용으로 AD104 GPU 기반의 L20 및 L2 PCIe 카드를 각각 개발하며 대응해왔다.