업계 최초의 RISC-V 기반 AI 학습 가속기 중 하나가 될 수 있습니다.

메타는 비용 절감과 엔비디아 의존도 축소를 위해 몇 년 전부터 RISC-V 기반의 AI 추론용 칩을 자체 개발한 선구적인 기업 중 하나였습니다. 로이터 통신 보도에 따르면, 메타는 나아가 (추정컨대 브로드컴의 지원을 받아) AI 학습을 위한 자체 가속기(accelerator)까지 설계했습니다. 이 칩이 메타의 목표를 달성한다면, 첨단 대규모 언어 모델(LLM) 학습 과정에서 H100/H200, B100/B200과 같은 고성능 엔비디아 AI GPU에 대한 의존도를 낮출 수 있을 것으로 기대됩니다.
메타와 브로드컴은 TSMC를 통해 메타 최초의 AI 학습 가속기 시제품을 제작(taped out)했으며, TSMC가 이 칩들의 최초 작동 샘플을 생산하는 데 성공했습니다. 이후 파트너들은 해당 장치를 성공적으로 가동(brought up)시켰다고 보고서는 전했습니다. 현재 메타는 생산 및 배포 규모를 확대하기에 앞서, 제한적인 규모로 가속기를 배치하여 성능을 평가하고 있습니다. 메타 엔지니어들이 이 신규 칩에 대해 벤치마크 테스트를 진행하고 있는지 여부는 명확하지 않으나, 이미 실질적인 작업에 투입되어 작동하고 있습니다.
이 칩의 구체적인 사양은 공개되지 않았지만, 일반적으로 AI 학습 칩은 시스톨릭 배열(systolic array)이라는 설계를 채택합니다. 이 아키텍처는 행과 열로 구성된 구조화된 네트워크이며, 동일한 처리 요소(PE, Processing Elements)들로 이루어져 있습니다. 각 유닛은 행렬 또는 벡터 연산을 처리하며, 데이터는 이 네트워크를 따라 순차적으로 흐릅니다.
메타의 새로운 MTIA 라인업, 하이퍼스케일러들의 전용 추론 칩 개발 흐름에 합류
이 프로세서는 방대한 데이터 처리가 필요한 AI 학습용으로 설계되었기 때문에, HBM3 또는 HBM3E 메모리를 탑재할 것으로 예상됩니다. 맞춤형 프로세서인 만큼, 메타는 다이(die) 크기, 전력 소비, 성능을 최적화하기 위해 지원하는 데이터 형식과 명령어를 직접 정의했습니다. 특히 성능 측면에서, 이 가속기는 H200, B200 등 엔비디아의 최신 AI GPU와 경쟁할 수 있는 전력 대비 성능(performance-per-watt)을 구현해야 합니다.
이 칩은 메타의 메타 학습 및 추론 가속기(Meta Training and Inference Accelerator, MTIA) 프로그램의 최신 결과물입니다. 이 프로그램은 개발 과정에서 유사 단계에서의 중단 등 여러 난관에 부딪히기도 했습니다.
과거에는 제한적인 배포 테스트를 진행했으나 성능 및 전력 목표를 충족시키지 못하면서 내부 추론 프로세서를 단종한 사례도 있습니다. 이러한 실패 경험은 메타가 2022년에 전략을 전환하도록 이끌었으며, 즉각적인 AI 처리 요구사항을 충족하기 위해 엔비디아 GPU를 대규모로 확보 주문했습니다.
이후 메타는 엔비디아의 최대 고객사 중 하나가 되었으며 수만 개의 GPU를 확보했습니다. 이 장비들은 추천, 광고, Llama Foundation 모델 시리즈와 같은 AI 모델 학습에 핵심적인 역할을 수행했습니다. 로이터 통신에 따르면, 메타의 GPU는 또한 추론 과정에 사용되어 메타 플랫폼 전반에 걸쳐 30억 명이 넘는 일일 사용자 상호 작용을 지원해 왔습니다.
이러한 어려움에도 불구하고 메타는 자체 실리콘(custom silicon) 프로그램을 지속적으로 발전시키고 있습니다. 지난해 메타는 추론 작업에 MTIA 칩을 사용하기 시작했으며, 향후 메타 경영진은 2026년까지 자체 칩을 AI 학습에 사용하기 시작하겠다는 계획을 제시했습니다. 이 계획은 칩이 성능 및 전력 목표를 충족하는지 점진적으로 검증하며 사용량을 늘리는 것이 목표이며, 이는 데이터 센터 운영을 위해 더욱 맞춤화된 하드웨어 솔루션을 설계하려는 메타의 장기적인 목표에서 중요한 축을 담당합니다.
흥미로운 점은 MTIA의 추론 가속기가 오픈소스 RISC-V 코어를 활용한다는 것입니다. 이를 통해 메타는 자체 요구사항과 일정에 맞춰 명령어 세트 아키텍처(ISA)를 자유롭게 커스터마이징할 수 있을 뿐만 아니라, 제3자에게 로열티를 지불할 필요가 없습니다. MTIA의 학습 가속기 역시 RISC-V ISA 기반일 가능성이 제기되지만, 이는 아직 불명확합니다. 만약 이 가정이 사실이라면, 메타는 업계 최고 수준의 성능을 자랑하는 RISC-V 기반 칩 중 하나를 개발했을 가능성이 높습니다.