화웨이, Atlas 950 슈퍼클러스터 공개: 1 ZettaFLOPS FP4 성능 제공 및 수십만 개의 950DT APU 탑재

hw_reporter

더 강력한 시스템이 곧 출시될 예정이다.

화웨이는 목요일에 열린 Huawei Connect 2025 컨퍼런스를 통해 차세대 데이터센터 규모의 AI 솔루션을 공개하며, AI 추론(inference)에서 1 FP4 ZettaFLOPS, AI 학습(training)에서 524 FP8 ExaFLOPS 성능을 제공할 수 있다고 발표했습니다. 새로운 SuperCluster 950 시스템은 회사의 Ascend 950DT 신경망 처리 장치(NPU) 수십만 개를 기반으로 하며, 지구상에서 가장 강력한 인공지능용 슈퍼컴퓨터 중 하나가 될 것으로 기대를 모으고 있습니다. 화웨이는 이 SuperCluster가 2026년 후반에 Nvidia의 Rubin 기반 시스템과 경쟁할 것으로 전망하고 있습니다.

막대한 성능

화웨이의 Atlas 950 SuperCluster는 64개의 Atlas 950 SuperPoD로 구성됩니다. SuperPoD는 회사의 랙 규모 AI 솔루션으로, Nvidia의 GB300 NVL72나 차세대 Vera Rubin NVL144와 유사한 형태입니다. Atlas 950 SuperCluster는 10,240개가 넘는 광학적 인터커넥트로 연결된 캐비닛에 분산된 524,288개의 Ascend 950DT AI 가속기를 기반으로 구축됩니다.

이 슈퍼컴퓨터는 AI 학습에 최대 524 FP8 ExaFLOPS, AI 추론에 최대 1 FP4 ZettaFLOPS(정확히는 MXFP4)의 성능을 제공할 수 있는 것으로 알려져 있습니다. 이 성능은 작년에 발표된 오라클의 OCI Supercluster(131,072개)와 비교했을 때 상당한 규모를 자랑합니다.

이 시스템은 근본적으로 최신 클라우드 아키텍처를 기반으로 설계되어, 복잡하고 대규모의 AI 워크로드를 처리할 수 있습니다.

기술적 이점
이 아키텍처는 데이터 병목 현상을 최소화하고, 최신 패키징 기술을 활용하여 전체적인 처리 효율성을 극대화합니다.

미래 전망
본 기술은 향후 AI 인프라 시장에서 핵심적인 역할을 수행할 것으로 예상됩니다.

로드맵 및 비전
이 시스템은 클라우드 네이티브 환경을 기반으로 설계되어, AI 워크로드의 증가와 시장 수요에 유연하게 대응할 수 있도록 확장성이 뛰어납니다.

로드맵 및 비전
이 플랫폼은 클라우드 네이티브 아키텍처를 기반으로 구축되어, 시장의 다양한 요구 사항에 맞춰 유연하게 확장할 수 있도록 설계되었습니다.

성능 및 전력 효율성
뛰어난 전력 효율성 덕분에 데이터 센터 운영 비용(OPEX) 절감에 크게 기여할 것입니다.

다음 세대 컴퓨팅 플랫폼
이 시스템은 차세대 컴퓨팅 플랫폼을 목표로 설계되었으며, 기존 인프라의 한계를 뛰어넘는 혁신적인 성능을 제공합니다.

결론
본 시스템은 AI, 빅데이터, HPC(고성능 컴퓨팅) 등 광범위한 분야에 걸쳐 최고의 성능과 안정성을 제공할 준비가 되어 있습니다.

[출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/huawei-unveils-atlas-950-supercluster-touting-1-fp4-zettaflops-performance-for-ai-inference-and-524-fp8-exaflops-for-ai-training-features-hundreds-of-thousands-of-950dt-apus