• AMD, 새로운 슈퍼컴퓨터 기록 경신... Instinct MI250X GPU로 CFD 시뮬레이션 25배 이상 가속화

    CFD 시뮬레이션 시간이 1,024개의 Instinct MI250X 가속기와 Epyc CPU를 결합하여 사용함으로써 거의 40시간에서 2시간 미만으로 단축되었습니다.

    article image

    AMD 프로세서는 최근 오크리지 국립 연구소(ORNL)의 Frontier 슈퍼컴퓨터에서 수행된 Ansys Fluent 전산 유체 역학(CFD) 시뮬레이션 과정에서 새로운 세계 기록을 달성하는 데 결정적인 역할을 했습니다. Ansys의 보도 자료에 따르면, 이번 시뮬레이션은 에너지 기술 기업인 Baker Hughes가 효율성 향상을 목표로 하는 차세대 가스 터빈을 테스트하기 위해 진행되었습니다. 이전에 3,700개 CPU 코어에서 38.5시간이 소요되던 22억 셀 규모의 축 터빈 시뮬레이션이, Frontier 시스템에서 AMD EPYC CPU와 1,024개의 AMD Instinct MI250X 가속기를 결합하여 구동된 결과, 시뮬레이션 시간이 1.5시간으로 획기적으로 단축되었습니다. 이는 25배가 넘는 속도 향상에 해당하며, 덕분에 Baker Hughes는 설계 변경이 성능에 미치는 영향을 훨씬 빠르고 효과적으로 확인할 수 있게 되었습니다.

    [관련 보도 내용] Ansys, Baker Hughes, 그리고 ORNL은 전 세계 최초의 액사스케일 슈퍼컴퓨터에서 22억 셀 규모의 초대형 상업용 CFD 시뮬레이션을 1,024개의 AMD Instinct GPU를 이용해 수행하며 새로운 역사를 썼습니다. 그 결과, 시뮬레이션 실행 시간을 96% 절감하는 성과를 거두었습니다. (2025년 4월 4일)

    Frontier는 한때 세계에서 가장 빠른 슈퍼컴퓨터이자 액사스케일 성능을 최초로 돌파한 시스템이었습니다. 이 시스템은 2024년 11월에 퇴역한 Summit 슈퍼컴퓨터를 대체했습니다. 다만, 로렌스 리버모어 국립 연구소에 위치한 El Capitan 슈퍼컴퓨터는 비슷한 시기에 Frontier의 기록을 경신하기도 했습니다. 두 시스템 모두 AMD GPU로 구동되는데, Frontier는 9,408개의 AMD EPYC 프로세서와 37,632개의 AMD Instinct MI250X 가속기를 탑재했습니다. 반면 El Capitan은 44,544개의 AMD Instinct MI300A 가속기를 사용합니다.

    이러한 사양을 고려했을 때, Ansys Fluent CFD 시뮬레이터는 Frontier가 제공하는 전체 컴퓨팅 자원 중 일부만을 사용한 것으로 해석됩니다. 이는 슈퍼컴퓨터에 가용된 모든 가속기를 최대로 활용할 경우, 더욱 빠르게 구동될 잠재력이 있다는 것을 의미합니다. 또한, AI GPU 시장에서 Nvidia가 시장을 주도하고 있음에도 불구하고, AMD는 CPU와 GPU를 통해 지구상 최고 수준의 슈퍼컴퓨터에 핵심 두뇌 역할을 수행하며 강력한 경쟁자로 자리매김하고 있음을 입증합니다.

    [시장 동향] AMD는 MI455X 출시 지연설을 부인했으며, Nvidia VR200 시스템의 조기 도착 루머에도 불구하고, 자체 밝힌 바에 따르면 'Helios 시스템은 2026년 하반기 목표'라고 밝혔습니다.

    AMD 데이터 센터 엔지니어링 수석 부사장인 브래드 맥크리디(Brad McCredie)는 "AMD Instinct GPU의 강력한 성능을 바탕으로 고정밀 CFD 시뮬레이션 소프트웨어를 전례 없는 수준으로 확장하면서, 이번 협업은 최첨단 슈퍼컴퓨팅이 효율성, 지속 가능성, 혁신 분야의 가장 까다로운 엔지니어링 난제들을 해결할 수 있음을 보여줍니다"라고 말했습니다.

    AMD가 Nvidia보다 훨씬 저렴한 가격으로 최고 수준의 성능을 구현할 수 있음에도 불구하고, 많은 AI 데이터 센터들이 소프트웨어 호환성 문제로 인해 여전히 '팀 그린(Team Green)'을 선호하는 경향이 있습니다.

    대표적인 사례로 Tiny Corp의 TinyBox 시스템이 있었는데, 이 시스템은 AMD Radeon RX 7900 XTX 그래픽 카드 사용 시 불안정성 문제가 발생하여 리사 수(Lisa Su) 박사의 개입으로 문제를 해결한 바 있습니다. 그럼에도 불구하고 해당 회사는 AMD 기반 버전과 Nvidia 기반 버전의 TinyBox AI 가속기를 모두 출시했으며, 드라이버 품질을 이유로 6개의 RTX 4090 GPU가 탑재된 고가형 '팀 그린' 버전을 권장하기도 했습니다.

    만약 '팀 레드(Team Red)'가 뛰어난 하드웨어 성능을 뒷받침할 소프트웨어 지원 문제점을 해결해 나간다면, AI GPU 시장에서 Nvidia와 대등한 입지를 확보하고 더 많은 고객층을 확보할 가능성이 높습니다.

    [출처:] https://www.tomshardware.com/tech-industry/supercomputers/amd-sets-new-supercomputer-record-runs-cfd-simulation-over-25x-faster-on-instinct-mi250x-gpus