더 나아가.

로스앨라모스 국립 연구소(Los Alamos National Laboratory)의 베라 루빈(Vera Rubin) 기반 슈퍼컴퓨터를 필두로, 엔비디아는 지난 화요일 GTC 2025에서 파트너들과 협력하여 아르곤 국립 연구소(Argonne National Laboratory)를 위한 7개 규모의 ExaFLOPS급 AI 슈퍼컴퓨터를 구축한다고 발표했습니다. 이 중 5개 시스템에 들어가는 2개는 오라클(Oracle)이 구축하며, 총 10만 개가 넘는 Blackwell GPU를 활용하여 최대 2,200 ExaFLOPS의 통합 성능을 제공할 예정입니다.
아르곤 국립 연구소의 5개 AI 슈퍼컴퓨터 중 첫 번째는 에퀴녹스(Equinox)입니다. 이 시스템은 10,000개의 Blackwell GPU를 탑재하며 프로젝트의 초기 단계로 2026년에 가동됩니다. 다음 단계인 솔스티스(Solstice)는 200 MW 규모의 시스템으로, 10만 개 이상의 Blackwell GPU가 장착됩니다. 이 두 시스템이 연결되어 AI 컴퓨팅을 위해 총 2,200 FP4 ExaFLOPS의 집계 성능을 발휘하게 됩니다.
엔비디아의 데이터 센터 제품 마케팅 책임자인 디온 해리스(Dion Harris)는 "엔비디아, 미국 에너지부(U.S. Department of Energy), 오라클이 블랙웰(Blackwell)을 핵심으로 하는 아르곤 국립 연구소에 두 개의 AI 팩토리(AI factory) 구축을 위해 파트너십을 맺게 된 것을 매우 자랑스럽게 생각합니다"라고 말했습니다. 그는 이어 "이번 협력은 미국의 과학 연구 및 개발 생산성을 획기적으로 끌어올리고 AI 분야에서 미국의 리더십을 확고히 하는 것을 목표로 합니다. 1단계로는 10,000개의 Blackwell GPU가 탑재된 에퀴녹스 시스템이, 2단계로는 2,200 ExaFLOPS의 AI 성능을 구현하는 200 MW급 AI 인프라가 포함됩니다"라고 밝혔습니다.

이 시스템들은 3조 개의 매개변수(parameter)를 갖는 AI 시뮬레이션 모델 구축은 물론, 전통적인 과학 컴퓨팅 분야에도 활용될 것입니다.
에퀴녹스 및 솔스티스 슈퍼컴퓨터에 대해 주목할 점은, 이 시스템들을 구축하는 주체가 오라클이라는 점입니다. 오라클은 전통적인 HPC 벤더(예: Atos, Dell, HPE)들이 고객 맞춤형 슈퍼컴퓨터를 직접 설계하고 구축하는 방식으로는 광범위하게 알려져 있지 않습니다. 오라클의 주요 사업 역량은 처음부터 맞춤형 HPC 시스템을 통합하는 것보다는 AI/HPC 워크로드를 구현할 수 있는 클라우드 인프라에 집중되어 있기 때문입니다. 오라클은 Cloud@Customer라는 옵션을 제공하고 있음에도 불구하고, 해당 장비들은 오라클 소프트웨어 환경에서 구동되며 오라클에 의해 관리됩니다. 따라서 에퀴녹스 및 솔스티스의 운영 및 관리 주체가 오라클로 확정될지는 아직 관망해야 할 부분입니다.

더 나아가, 아르곤 국립 연구소는 연구원과 과학자들을 대상으로 하는 경쟁적인 국가 프로그램(competitive national programs)을 통해 이용 가능한 아르곤 리더십 컴퓨팅 시설(Argonne Leadership Computing Facility)을 엔비디아 기반 슈퍼컴퓨터인 타라(Tara), 미네르바(Minerva), 재너스(Janus) 등을 포함하여 확장할 계획입니다. 현재로서는 이 시스템들이 어떤 플랫폼을 사용할지, 또는 HPE나 오라클 중 누가 구축할지는 명확하지 않지만, 강력한 성능을 제공할 것이 확실시됩니다.
아르곤 국립 연구소의 디렉터인 폴 K. 카른스(Paul K. Kearns)는 "엔비디아 및 오라클과의 협력은 국가 AI 및 컴퓨팅 인프라 발전의 중대한 이정표를 세우는 일입니다"라고 말했습니다. 그는 "이번 파트너십을 통해 우리는 성능, 확장성, 과학적 잠재력을 재정의하는 플랫폼을 구축하고 있습니다. 우리는 함께 수십 년간의 과학적 발견을 이끌 차세대 컴퓨팅의 토대를 마련하고 있습니다"라고 덧붙였습니다.
최신 뉴스, 분석 및 리뷰를 받아보려면 구글 뉴스에서 Tom's Hardware를 팔로우하거나 즐겨찾는 소스로 추가하세요.