RTX 5090D 출시가 미국의 수출 규제 한계에 근접했다.

엔비디아의 차기 중국 시장 맞춤형 RTX 5090D가 특정 워크로드를 실행할 수 없도록 제한(lockdown)된 것으로 알려졌다. Chiphell 포럼의 한 사용자 보고에 따르면, RTX 5090D는 작동 후 약 "3초"가 지나면 스스로 잠기면서 특정 워크로드 실행, GPU 오버클럭, 전력 제한 파라미터 조정은 물론, 멀티 GPU 환경에서의 사용까지 불가능하게 만든다고 한다.
RTX "D-시리즈"(Dragon)는 GPU 성능을 기준으로 미국 수출 규제를 충족시키기 위해 특별히 설계된 커스터마이징 엔비디아 GPU다. 이전 세대인 RTX 4090은 중국으로 합법 수출하기에는 성능이 과도했다. 이에 엔비디아는 규정을 맞추기 위해 순정 모델 대비 성능이 약간 낮춘 RTX 4090D를 출시했다. RTX 5090D는 이 RTX 4090D의 후속 모델이다.
엔비디아는 RTX 5090에서도 이와 같은 전략을 반복해야 했지만, RTX 5090D 변형에서는 그 실행 방식이 달라졌다. 이전 세대 RTX 4090D는 순정(vanilla) RTX 4090 대비 GPU 사양이 물리적으로 축소되었는데, CUDA 코어는 12.8% 적고, 최대 전력은 5.9% 낮았으며, 기본 클럭 속도 또한 미묘하게 달랐다. 하지만 RTX 5090D는 기본 클럭과 부스트 클럭에 이르기까지 순정 RTX 5090의 전체 사양을 그대로 채택했다. 유일하게 변경된 부분은 AI 성능으로, 이 부분이 "마법처럼" 29%나 대폭 하향 조정되었다.
참고 보도: 베이징, H200 구매를 ‘특별한 사유’가 있는 사용자에게로 제한한다는 보도
참고 보도: 중국 세관, H200 수입 차단 관련 보고
이러한 현상을 '마법적'이라고 표현하는 이유는 엔비디아가 RTX 5090D의 AI 성능을 어떻게 인위적으로 저하했는지 여전히 미스터리이기 때문이다. 성능이 3,352 AI TOPS에서 2,375 AI TOPS로 급락했다.
Chiphell 사용자 분석에 따르면, 엔비디아는 RTX 5090D의 성능을 제어하기 위해 인위적인 드라이버 및/또는 펌웨어 제한에 크게 의존하는 것으로 보인다. 예를 들어, 드라이버는 AI 추론 또는 암호화폐 채굴 워크로드를 감지할 경우 RTX 5090D의 성능을 3초의 하드 리미트로 고정하는 것으로 추정된다. 흥미롭게도 생성형 AI 워크로드에는 영향을 받지 않는 듯하다.
RTX 5090D는 수정 불가능한 전력 제한이 걸려 있어 사용자가 이를 악용하여 오버클럭하는 것이 원천적으로 불가능하다. 반면, RTX 4090D의 전력 제한은 걸려있지 않아 사용자가 이를 600W까지 해제하여 성능을 되찾고 오버클럭할 수 있었다.
Chiphell 사용자는 RTX 5090D가 온라인이나 클라우드를 통해 조작하거나 변경할 수 없으며, 멀티 GPU 환경에서 작동할 수 없음을 명확히 했다. 엔비디아는 이 기능을 "리눅스 시스템의 가장 낮은 계층"까지 제한한 것으로 알려졌다. 사용자는 다른 GPU를 설치했을 때의 동작 방식은 공유하지 않았지만, 어떠한 경우에도 RTX 5090D는 다른 GPU와 함께 아무런 워크로드도 병렬로 실행할 수 없을 것으로 보인다.
엔비디아의 이러한 제한 장치들이 실제로 효과를 발휘할지는 시간이 말해줄 것이다. 대규모 GPU 부족 사태 때 발생했던 LHR(Lite Hash Rate) 사태를 기억하는가? LHR은 암호화폐 채굴자들이 재고를 모두 소진하는 것을 막기 위해 RTX 30 시리즈 GPU의 채굴 성능을 제한하려는 목적이었다. 그러나 개인 및 조직들은 이 제한을 우회할 방법을 찾는 데 오랜 시간이 걸리지 않았다.