향후 몇 년에 걸친 양적, 질적 향상

엔비디아는 이번 GPU 기술 컨퍼런스(GPU Technology Conference)에서 업데이트된 데이터 센터 제품 로드맵을 공개하며 여러 놀라운 소식과 함께, 회사가 2년마다 완전히 새로운 GPU 아키텍처를 출시하고 매년 AI GPU 패밀리를 업데이트할 계획임을 재차 확인했습니다. 주목할 만한 점은, 엔비디아가 로드맵에서 이전에 언급된 적이 없던 Rosa CPU와 함께, 다이 스태킹(die stacking) 및 커스텀 HBM 메모리를 활용하는 Feynman GPU를 사용할 계획이라는 것입니다.
예상대로 엔비디아는 올해 Vera CPU와 Rubin GPU를 기반으로 하는 Vera Rubin 플랫폼을 선보입니다. 이 플랫폼은 Groq LP30 저지연 추론 가속기, BlueField-4 데이터 처리 장치(DPU), NVLink-6 스위치, 코패키징 광학을 적용한 Spectrum-X 이더넷, 그리고 ConnectX 9 1600G 슈퍼NIC 등 다섯 가지 추가 프로세서를 포함합니다.
Vera Rubin 플랫폼은 새로운 CPU 및 GPU 아키텍처 덕분일 뿐만 아니라, 엔비디아가 자체 Groq LPU를 하드웨어 포트폴리오에 통합한다는 점에서 의미가 깊습니다. 더욱이, 회사는 자체 개발한 Rubin CPX 프로세서보다 LPU에 더 큰 비중을 두는 듯 보여, 로드맵에서 후자에 대한 언급을 제외했습니다.
내년에는 회사가 4개의 컴퓨트 치프렛(compute chiplets)을 탑재하고 1 TB의 HBM4E 메모리를 갖춘 Rubin Ultra AI 가속기로 제품군을 업데이트할 예정이며, 이는 기존 Rubin 대비 성능을 대폭 향상시킬 것입니다. 이 GPU 가속기들은 NVFP4 데이터 형식을 지원하는 Groq LP35 LPU와 결합하여 성능을 개선할 것입니다.

엔비디아 AI 플랫폼의 또 다른 핵심 성능 향상 요소는 Kyber NVL144 랙 스케일 솔루션의 도입입니다. 이는 144개의 Rubin Ultra GPU 패키지(NVLink 7 스위치로 구현)를 집적하여, 72개의 Blackwell GPU 패키지를 가진 Oberon NVL72 랙 대비 최소 4배의 성능 향상을 제공합니다.
엔비디아의 데이터 센터 포트폴리오는 2027년에 랙당 GPU 개수를 늘리는 등(정량적 개선)의 향상과 NVFP4 지원 LPU를 도입하며 개선될 것입니다. 2028년 데이터 센터 제품은 회사 제품에 질적인 개선을 가져올 완전히 새로운 아키텍처를 기반으로 합니다.
젠슨 황 엔비디아 CEO는 GTC에서 "여기서 다음 세대는 Feynman입니다"라며, "Feynman에는 물론 새로운 GPU가 있습니다. 또한 새로운 LPU인 LP40도 있습니다. 엔비디아의 규모와 Groq가 LP40을 함께 통합함으로써 놀라운 결과가 나올 것입니다. 로잘린(Rosalyn)의 약자인 Ros라는 완전히 새로운 CPU와 Bluefield-5는 다음 세대 CPU를 다음 슈퍼NIC CX10에 연결합니다. 우리는 구리 규모 확장(copper scale up)을 갖춘 Kyber와 CPO 규모 확장(CPO scale-up)을 갖춘 Kyber를 가지게 될 것입니다. 따라서 처음으로 구리와 코패키징 광학 모두를 활용한 규모 확장이 이루어집니다."라고 밝혔습니다.
가장 먼저, 엔비디아의 Feynman 데이터 센터 GPU는 다이 스태킹을 채택하여 회사의 성능 확장 방식을 혁신할 것입니다. 둘째, Feynman GPU는 또한 커스텀 고대역폭 메모리(C-HBM4E 변형일 가능성이 높음)를 사용할 것으로 예상되며, 이는 엔비디아가 GPU 패키지당 HBM 용량을 1 TB 이상으로 높이고 메모리 대역폭을 증가시키는 것을 가능케 할 것입니다.

셋째, Feynman 플랫폼은 엔비디아가 최고 수준의 싱글 스레드 성능에 중점을 두고 자체 개발한 차세대 프로세서인 Rosa CPU를 탑재합니다. Rosa의 등장은 회사가 CPU 개발 주기를 4년에서 2년으로 단축했음을 보여주는데(새로운 설계팀 도입으로 추정), 이는 AMD와 Intel 같은 주요 CPU 개발사들과 대등한 위치에 서게 된 것으로, 이들 경쟁사들이 보통 몇 년 주기로 새로운 마이크로 아키텍처를 출시하는 경향과 맞먹습니다.
넷째, 이 플랫폼은 Nvidia의 NVFP4 포맷을 지원할 뿐만 아니라, NVLink 프로토콜을 통해 다른 시스템 구성 요소와 연결할 LP40 LPU도 통합합니다. 이를 통해 Groq 하드웨어가 Nvidia의 GPU와 통합됩니다.
다섯째, Feynman 플랫폼은 코패키징 광학(co-packaged optics)이 적용된 NVLink 스위치를 채택하는 최초의 플랫폼이 될 것입니다. 이는 NVLink 프로토콜을 활용한 광학 인터커넥트를 가능하게 합니다(현재 불가능한 것은 아니나, CPO는 구현을 훨씬 용이하고 저렴하게 만듭니다). 광학 인터커넥트는 엔비디아가 랙 규모 솔루션의 확장 가능한 워크로드를 Oberon 섀시를 사용하는 576 GPU 패키지 또는 Kyber 섀시를 사용하는 1152 GPU 패키지까지 확대할 수 있도록 하여, 현재 대비 AMD의 Instinct나 하이퍼스케일러가 배치하는 맞춤형 가속기와 같은 대체 솔루션에 더욱 강력한 경쟁력을 갖게 할 것입니다.
마지막으로, 엔비디아는 2028년에 BlueField 5 DPU, 코패키징 광학을 적용한 7세대 SpectrumX 이더넷, 그리고 ConnectX 10 SuperNIC를 출시할 계획입니다.