핵심 리더, 연구원, 엔지니어들이 'CUDA 해자'를 어떻게 극복할지 논의합니다.

AI 워크로드를 위한 클라우드 플랫폼인 텐서웨이브(TensorWave)가 AMD의 MI Instinct 가속기를 기반으로 한 '비욘드 CUDA(Beyond CUDA) 서밋'을 오늘 개최합니다. 본 행사는 'CUDA 해자(CUDA moat)' 개념에 초점을 맞추고, 개발자들이 다른 대안을 활용하여 AI 중심 워크로드를 최적화하는 방법에 집중합니다. 참석자들은 지엠 켈러(Jim Keller)와 라자 코두리(Raja Koduri) 같은 컴퓨터 아키텍트의 아이콘들을 포함한 AI 분야의 저명한 리더들로부터 시연, 통찰력 분석, 패널 토론, 전문 의견 등을 기대할 수 있습니다.
AI 분야 하드웨어의 대다수는 엔비디아(Nvidia)가 구축한 GPU로 이루어져 있다는 것은 공공연한 사실입니다. AMD의 Instinct 가속기는 엔비디아 하드웨어와 비교할 만한 성능을 제공하지만, 이미 확립되고 성숙한 CUDA 생태계는 일부 사용자 및 조직에게 필수적입니다. 엔비디아는 초기부터 GPU에서의 병렬 컴퓨팅 잠재력을 인식하고 CUDA라는 독자적인 플랫폼을 개발했으며, 이는 현재 GPU 가속 컴퓨팅의 사실상의 표준이 되었습니다.
지속적인 노력, 최적화, 그리고 GPU를 동력으로 활용하는 AI의 급부상을 거치며 엔비디아는 선도적인 솔루션 제공업체로 입지를 다졌습니다. 실제로 엔비디아 매출의 90%가 현재 데이터센터 제품에서 발생하고 있으며, 이때 CUDA가 핵심적인 판매 포인트로 작용합니다. 이는 CUDA(소프트웨어)가 사실상 업계를 엔비디아 하드웨어에 종속시키는 공급업체 종속성(vendor lock-in) 상황을 초래하며, 혁신과 경쟁을 제한하는 요인으로 작용하고 있습니다.
엔비디아 GTC 2026 기조연설 라이브 블로그 — Vera Rubin GPU 및 CPU, DLSS 5, 그리고 '기술의 미래'
업계는 보다 개방적이고 하드웨어 비종속적인 미래로 전환을 모색하고 있지만, 이는 말로만 쉬운 것이 아닙니다. 저희에게는 OpenCL, ROCm, oneAPI, Vulkan과 같은 대안들이 존재하지만, 각 플랫폼은 어느 한 가지 혹은 여러 측면에서 엔비디아에 미치지 못하는 부분이 있습니다. 이때 '비욘드 CUDA'가 등장하여, AI 분야의 핵심 인물들이 모여 보다 다양하고 이질적인 미래를 개발하는 데 힘을 모으고 있습니다. 텐서웨이브가 주최하는 비욘드 CUDA 서밋은 하드웨어 유연성, 비용 효율성, 그리고 CUDA를 대체할 수 있는 다양한 대안 모색 등 AI 컴퓨팅 산업이 직면한 여러 과제들을 다룰 예정입니다.
ROCm과 같은 플랫폼이 CUDA와 동등한 수준에 도달하려면 상당한 개발 노력이 필요합니다. 심지어 현시점에서도 ROCm은 소수의 최신 GPU만 지원하는 반면, CUDA는 2006년으로 거슬러 올라가는 하드웨어와의 호환성을 유지하고 있습니다. AMD의 최신 RDNA 4 GPU는 아직 ROCm에서 공식 지원되지 않습니다. 개발자들은 오랫동안 AMD가 신규 하드웨어에 대한 새로운 기능 및 지원을 느리게 채택하는 것에 대해 지적해 왔습니다. 긍정적인 측면으로는 Strix Halo가 현재 Windows에서만 ROCm과 호환된다는 점을 들 수 있습니다.
샌호세에 거주하는 분들에게는 주목할 만한 정보입니다. 서밋이 열리는 길드하우스(The Guildhouse)는 아이러니하게도 엔비디아의 GTC가 열리는 마크애너리 컨벤션 센터(McEnery Convention Center)에서 불과 세 블록 거리에 위치합니다. 참가자들은 64GB의 HBM2e 메모리를 탑재한 AMD Instinct MI210 GPU를 획득할 기회도 있습니다. 행사는 태평양 표준시(PDT) 기준 오후 12시부터 오후 10시까지 진행되며, 다양한 세션을 위해 네 개의 시간대가 마련됩니다. 서밋에 대한 더 자세한 내용은 여기서 확인하실 수 있습니다.