• 화웨이 아센드 AI 910D 프로세서, 엔비디아 블랙웰 및 루빈 GPU와 겨룰 준비 완료

    이를 위해서는 훨씬 더 많은 칩과 성능(파워)이 필요할 것입니다.

    article image

    로이터 통신에 따르면, 화웨이의 차세대 HiSilicon Ascend 910D AI 프로세서는 엔비디아(Nvidia)의 H100보다 향상된 성능을 제공할 것으로 예상된다. 다만, 이 새로운 프로세서는 칩 단위로만 비교했을 때는 엔비디아의 Blackwell B200 및 Blackwell Ultra B300 GPU보다 느릴 수 있으며, 내년 출시 예정인 차세대 Rubin GPU와 비교하기는 더욱 어렵다. 그러나 화웨이가 수백 개의 프로세서로 '포드(pod)'를 구축하는 접근 방식을 취하면서, Ascend 910D는 엔비디아의 현행 Blackwell 및 향후 Rubin GPU 기반 포드와 경쟁력을 갖출 것으로 기대된다.

    화웨이는 미국 수출 제한이라는 상황 속에서 자국 대안을 마련하기 위해 가장 진보된 AI 프로세서인 Ascend 910D의 테스트를 준비하고 있으며, 목표는 엔비디아 H100 성능을 초과하는 것이다. 소식통에 의하면, 화웨이는 새로운 Ascend 910D 칩이 성능 및 배포 요구 사항을 충족하는지 평가하기 위해 여러 현지 기업에 접촉했다. 초기 샘플은 5월 말경에 공개될 예정이다.

    한편, 화웨이는 차세대 이중 칩렛(dual-chiplet) Ascend 910C AI 프로세서를 중국 고객사(그리고 이 칩을 기반으로 한 전체 시스템)에 다음 달 초부터 대규모로 출하할 계획이다. 이 프로세서 다수는 제3의 기업을 위해 TSMC가 생산한 것으로 전해졌다. Ascend 910D가 중국 기반의 SMIC에서 제작될지, 아니면 미국 정부가 화웨이의 최첨단 반도체 생산 능력 접근을 제한한 지 거의 5년이 지난 시점에서 화웨이가 또다시 미국 제재를 우회하는 방법을 찾을 수 있을지는 미지수다.

    화웨이에게 엔비디아 H100 수준의 성능에 도달하는 것은 쉽지 않을 전망이다. 이 회사의 최신 이중 칩렛 Ascend 910C는 약 780 BF16 TFLOPS의 성능을 제공하는 반면, 엔비디아 H100은 약 2,000 BF16 TFLOPS를 처리할 수 있다. H100 수준의 성능을 달성하려면 화웨이가 Ascend 910D의 내부 아키텍처를 재설계하고 컴퓨팅 칩렛(compute chiplet) 수를 늘리는 방안을 모색해야 할 수 있다. 내년 AI 산업에서 경쟁력을 유지하려면, 화웨이는 미국에서 개발된 AI 클러스터에 필적하는 성능을 반드시 달성해야 할 것이다.

    올해 화웨이는 384개의 Ascend 910C 프로세서를 탑재한 CloudMatrix 384 시스템을 선보였다. 이 시스템은 특정 워크로드에서는 엔비디아 GB200 NVL72를 능가할 수 있다는 보고가 있지만, 성능 대비 전력 효율성(performance-per-watt)이 급격히 떨어져 전력 소비가 매우 높다는 단점을 안고 있다. 또한, 물리적인 'AI 프로세서'의 개수 자체는 NVL72 랙보다 5배 이상 많다. 그러나 요구되는 프로세서 수에 맞춰 인터커넥트(interconnect)가 얼마나 잘 확장될 수 있는지는 여전히 과제다. 최첨단 공정 기술에 대한 접근성이 부재하기 때문에, 화웨이가 내년 시장에서 경쟁 우위를 유지하는 것은 훨씬 더 어려워질 전망이다.

    엔비디아는 AI 및 HPC용 코드명 루빈(Rubin) GPU를 2026년에 도입할 예정이며, 이 칩은 TSMC의 N3(또는 그 이상 진보된) 제조 공정으로 제작되어 현세대 Blackwell GPU보다 훨씬 높은 와트당 성능을 제공할 것으로 기대된다. 루빈 GPU는 약 8,300 TFLOPS의 FP8 학습 성능과 추정컨대 BF16의 경우 절반 수준(B200보다 약 두 배)의 성능을 보여줄 것으로 예상된다.

    결론적으로, AI 시장에서 화두가 되고 있는 점은, Ascend 910과 같은 국산 반도체와 같은 대안적인 솔루션들은 고성능을 구현하고 있지만, 엔비디아의 최신 제품군이 보여주는 근본적인 기술적 우위와 효율성을 뛰어넘기 위해서는 더 근본적이고 획기적인 아키텍처 개선과 공정 기술 확보가 필수적이라는 점이다.

    [출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/huawei-ascend-ai-910d-processor-designed-to-take-on-nvidias-blackwell-and-rubin-gpus