랙당 최대 600kW의 미래를 계획하세요.

엔비디아는 GTC 2025에서 차세대 루빈 울트라(Rubin Ultra) GPU의 모형(mockup)과 NVL576 Kyber 랙 및 관련 인프라를 공개했습니다. 이 시스템은 2027년 하반기 출하를 목표로 하고 있어 아직 시점이 많이 남아있음에도 불구하고, 엔비디아는 AI 인프라 기업으로서 현재 위치에서 몇 년 후의 목표 지점까지의 청사진을 명확히 제시하고 있습니다. 이 미래 청사진에는 랙당 최대 600kW의 전력을 소비하는 고성능 GPU 서버가 포함됩니다. 현재의 블랙웰 B200 서버 랙만 해도 랙당 최대 120kW(±)에 달하는 막대한 전력을 사용합니다.


다만, 2026년 하반기 출시 예정인 최초의 베라 루빈(Vera Rubin) 솔루션은 기존 Grace Blackwell과 동일한 인프라를 사용하게 되나, 다음 단계의 루빈 울트라 솔루션은 랙당 GPU 개수를 4배 증대시킬 계획입니다. 젠슨 황 CEO가 Q&A 세션에서 확인했듯이, 이로 인해 600kW까지 전력을 소비할 수 있는 단일 랙 솔루션이 가능하며, 전체 SuperPODs를 구성할 경우 수 메가와트(multi-megawatts) 규모의 전력을 필요로 합니다. Kyber는 이러한 플랫폼에 적용될 랙 인프라의 이름입니다.


루빈 울트라에 대한 확정된 사양은 아직 없지만, 성능 목표치(performance targets)는 공개되었습니다. 키노트 및 엔비디아의 데이터센터 GPU 로드맵에 따르면, 블랙웰 울트라 B300을 넘어선 제품 라인업에서 루빈 NVL144 랙은 내년 하반기에 최대 3.6 EFLOPS의 FP4 추론 성능을 제공할 예정이며, 2027년 루빈 울트라 NVL576 랙은 최대 15 EFLOPS의 FP4 성능을 목표로 합니다. 이는 컴퓨팅 밀도와 전력 밀도 모두에서 엄청난 도약을 의미합니다.


(광고 문구 제외)


각 루빈 울트라 랙은 네 개의 '포드(pod)'로 구성되며, 각 포드 자체의 컴퓨팅 성능은 전체 루빈 NVL144 랙보다 강력할 것으로 예상됩니다. 각 포드는 18개의 블레이드(blade)를 탑재하며, 각 블레이드는 최대 8개의 루빈 울트라 GPU와 (명시되지는 않았으나 예상되는) 2개의 베라 CPU를 지원할 것입니다. 이는 포드당 176개의 GPU, 그리고 랙당 총 576개의 GPU가 탑재된다는 의미입니다.


NVLink 유닛 역시 업그레이드되어 각각 세 개의 차세대 NVLink 연결을 갖게 되며, 기존의 NVLink 1U 랙 마운트 유닛은 두 개의 NVLink 연결만 가지고 있습니다. Kyber 랙 전시물에는 NVLink 및 루빈 울트라 블레이드의 프로토타입 또는 목업이 함께 공개되었습니다. 아직 명확한 전력 수치가 제공되지는 않았으나, 젠슨 황은 향후 데이터센터가 서버 랙당 메가와트급 전력을 요구할 수 있다고 언급했습니다. Kyber 자체가 그 수준은 아니지만, 그 이후 세대 모델들은 랙당 1MW를 훨씬 초과할 수 있으며, Kyber는 블랙웰 시리즈의 GPU당 기존 1000~1400와트 수준을 유지하여 약 600kW를 목표로 하고 있습니다.