엔비디아의 루빈(Rubin) 플랫폼은 10Gb/s HBM4에 크게 베팅하고 있지만, 속도 때문에 공급 위험이 따르며, 여기에 AMD의 MI450 출시가 임박했다.

엔비디아(Nvidia)는 메모리 공급업체들을 대상으로 JEDEC의 공식 HBM4 기준치를 뛰어넘도록 압박하고 있습니다. 트렌드포스(TrendForce)에 따르면, 엔비디아는 2026년 베라 루빈(Vera Rubin) 플랫폼용 10Gb/s-per-pin 스택을 요청했는데, 이는 차세대 AMD MI450 Helios 시스템에 앞서 GPU당 대역폭을 높이기 위한 전략입니다.
JEDEC이 HBM4의 속도로 지정한 핀당 8Gb/s를 기준으로 할 때, 단일 스택은 새로운 2,048비트 인터페이스를 통해 2TB/s에 약간 못 미치는 대역폭을 제공합니다. 이를 10Gb/s로 높이면 스택당 총 대역폭이 2.56TB/s로 증가합니다. 6개 스택을 사용할 경우, 단일 GPU는 총 15TB/s의 순수 대역폭을 확보하게 됩니다. 엔비디아의 컴퓨팅 최적화 구성을 통해 가장 까다로운 추론(inference) 워크로드를 처리하도록 설계된 루빈 CPX는 전체 NVL144 랙에서 초당 1.7페타바이트(PB/s)로 홍보됩니다. 핀 속도가 높아질수록, 엔비디아가 해당 성능 수치를 달성하기 위해 다른 영역에서 확보해야 할 여유 자원(마진)은 더욱 줄어듭니다.
하지만 10Gb/s HBM4를 구동하는 것은 결코 쉽지 않습니다. I/O 속도가 빨라질수록 전력 소모는 늘어나고, 타이밍 제약은 더욱 엄격해지며, 베이스 다이(base die)에 가해지는 부담이 커집니다. 트렌드포스는 비용 또는 열 관리 문제가 급격히 상승할 경우, 엔비디아가 HBM 티어별로 루빈 SKU(재고 관리 단위)를 분리(segment)할 수 있다고 지적했습니다. 즉, 루빈 CPX에는 10Gb/s 부품을 사용하고, 일반 루빈 구성에는 더 낮은 속도의 스택을 적용하게 된다는 의미입니다. 이에 대한 대안으로, 수율(yield)을 확보하기 위해 공급업체 검증 과정을 순차적으로 진행하고 검증 기간을 연장하는 방안이 이미 검토되고 있습니다.
SK하이닉스는 여전히 엔비디아의 주요 HBM 공급업체이며, HBM4 개발을 완료하고 양산 준비가 되었다고 밝혔습니다. 이 회사는 "10Gb/s 초과" 성능을 언급했으나, 구체적인 다이 사양, 전력 목표 또는 공정 세부 사항은 공개하지 않았습니다.
반면 삼성은 노드 마이그레이션 전략에서 더 적극적입니다. 삼성의 HBM4 베이스 다이는 더 높은 클럭 속도와 낮은 스위칭 전력 공급이 가능하도록 로직 클래스 노드인 4nm FinFET으로 이동합니다. 이는 SK하이닉스가 더 많은 물량을 출하하더라도 삼성에게 고성능 영역에서 우위를 점할 수 있는 발판이 될 수 있습니다. 마이크론은 2,048비트 인터페이스와 2TB/s를 초과하는 대역폭을 가진 HBM4 샘플링을 확인했지만, 10Gb/s 구현 여부는 아직 밝히지 않았습니다.
AMD의 MI450은 아직 시장에 출시되지 않았으나, 메모리 사양은 이미 공개되었습니다. Helios 랙은 GPU당 최대 432GB의 HBM4를 지원할 것으로 예상되어, AMD가 원시 용량 면에서 엔비디아와 동등하거나 능가할 수 있는 경로를 갖게 됩니다. 또한 CDNA 4를 통해 루빈이 강점으로 내세우는 추론(inference) 성능에 직접 겨냥한 아키텍처 업그레이드도 확보합니다.
엔비디아는 명확하게 메모리 속도를 끌어올리려 하고 있습니다. 하지만 10Gb/s HBM4에 의존도가 높아질수록, 오차의 여지가 줄어드는 현 시점에서 공급업체 편차, 수율 위험, 그리고 랙 단위의 전력 제약에 더욱 취약해질 위험을 안게 됩니다.
최신 뉴스, 분석 및 리뷰를 피드에서 받아보려면 Google News에서 Tom's Hardware를 팔로우하거나 선호 출처로 추가하십시오. 팔로우 버튼을 클릭하는 것을 잊지 마세요!
[출처:] https://www.tomshardware.com/pc-components/gpus/nvidia-wants-10gbps-hbm4-to-rival-amd-mi450