델이 최초로 클러스터를 선보였습니다.

Dell은 목요일, 선도적인 AI 클라우드 서비스 제공업체(CSP)인 CoreWeave에 업계 최초로 Nvidia의 GB300 NVL72 플랫폼을 기반으로 구축된 시스템을 제공했다고 발표했습니다. CoreWeave에 따르면, 이 회사는 데이터 센터 호스팅 제공업체인 Switch를 통해 Blackwell Ultra 기반 클러스터를 배치했습니다.
Dell과 CoreWeave의 초기 배포 모델에는 랙당 72개의 Nvidia Blackwell Ultra GPU, 36개의 Arm 기반 72코어 Grace CPU, 그리고 36개의 BlueField DPU가 탑재된 Dell 통합 랙이 포함됩니다. 각 GB300 NVL72 랙은 1.1 ExaFLOPS의 밀집 FP4 추론 성능과 0.36 ExaFLOPS의 FP8 훈련 성능을 제공하며, 이는 GB200 NVL 대비 50% 높은 수치입니다. 또한, 각 GB300 NVL72 랙은 20 TB의 HBM3E와 총 40 TB의 RAM을 탑재하고 있습니다. 더 나아가, 이 새로운 랙 규모 솔루션은 최대 14.4 GB/s의 스케일 아웃 연결을 위해 Nvidia의 Quantum-X800 InfiniBand 스위치와 ConnectX-8 SuperNIC을 활용합니다.
최대 훈련 및 추론 성능을 극대화하도록 설계된 이러한 고밀도 시스템은 높은 전력 소비(GPU당 최대 1,400W) 때문에 액체 냉각 방식을 채택했습니다.
회사 성명에 따르면 "Dell이 제공하는 Nvidia GB300 기반 솔루션은 단순한 이정표를 넘어섭니다. 이는 고객과 파트너들이 우리 전문성을 계속 신뢰하고 있음을 보여줍니다. 컴퓨팅, 네트워크, 스토리지 세 가지 요소를 하나의 통합된 솔루션으로 설계하고, 통합 및 배포 서비스를 통해 정밀하게 조정함으로써, 고객들이 전례 없는 속도와 규모로 움직일 수 있도록 지원합니다. 저희만이 구현할 수 있는 지속적인 혁신과 속도야말로 고객들에게 힘을 실어주고, CoreWeave, Nvidia 등 여러 파트너들과 함께 작업 속도를 가속화하는 동력입니다."라고 언급했습니다.
Dell은 이 랙 규모 시스템이 조립 및 테스트가 완료된 상태로 제공되며, 생산 환경에서 신속하게 설치하고 배포할 수 있도록 설계되었다고 덧붙였습니다. 이는 Dell과 CoreWeave가 업계에 앞서 Nvidia의 최신 AI GPU 플랫폼을 배치하는 두 번째 사례입니다. 이러한 성과는 하드웨어, 소프트웨어, 서비스를 통합적인 오퍼링으로 결합하고 이를 신속하게 배포하기 위해 Nvidia와 긴밀히 협력한 결과입니다.
이번 배포를 통해 CoreWeave는 더욱 진보된 대규모 언어 모델(LLM) 훈련, 추론 프로세스 및 추론 작업을 처리할 수 있도록 클라우드 플랫폼을 강화할 수 있게 됩니다. CoreWeave가 GB300 NVL72 기반 랙을 늘려갈수록, 고객에게 제공되는 총 성능은 더욱 증가할 것입니다.
흥미롭게도 Dell과 CoreWeave가 최초의 GB200 NVL72 머신을 배치한 지 불과 약 7개월 만에 GB300 NVL72 랙을 배치했다는 점은 주목할 만합니다. 이는 기존 GB200 플랫폼의 시장 수명에 대한 의문을 제기하기도 합니다 (비록 약간 지연되었음에도 불구하고). CSP 관점에서 볼 때, 구형 Blackwell 시스템에 투자하는 것보다 더 높은 성능의 Blackwell Ultra 머신에 투자하는 것이 훨씬 합리적이라는 해석이 지배적입니다. 따라서 Nvidia의 Blackwell Ultra에 상당한 잠재 수요가 존재할 수 있으며, 이는 Nvidia가 상반기 대비 더 큰 매출을 기록할 수 있는 요인이 될 것으로 예상됩니다.
최신 뉴스, 분석 및 리뷰를 피드에서 받으려면 Tom's Hardware를 구글 뉴스에서 팔로우하십시오. '팔로우' 버튼을 클릭해 주세요.