VOPD3는 컴파일러가 명령어들을 더 유연하게 쌍으로 묶을 수 있도록 할 것입니다.

AMD의 차세대 Radeon GPU는 RDNA 4 대비 상당한 업그레이드가 될 것으로 예상되며, Team Red가 중점적으로 해결하려는 과제 중 하나는 듀얼 이슈 실행(dual issue execution)입니다. 이는 GPU가 단일 사이클 내에서 두 개의 명령을 처리할 수 있는 능력을 말합니다. AMD의 카드들은 RDNA 3부터 이 기능을 지원해 왔으나, 기존의 엄격한 페어링 규칙(strict pairing rules) 때문에 컴파일러가 항상 이 기능을 활용하지 못해 이론적 최대 성능에 제한이 있었습니다. 새로운 LLVM 패치는 이제 AMD가 RDNA 5에서 이 문제를 해결할 것임을 시사합니다.
Desktop Roadmap
Enterprise Roadmap

Rubin in-depth
Linux에 중점을 둔 매체인 Coelacanth's Dream은 이 새로운 변경 사항들을 조사하며, 이들이 gfx13을 참조하고 있으며, 이는 gfx130(별칭 RDNA 5)에서 파생된 것임을 알아냈습니다. AMD는 'VOPD3'라는 새로운 명령어 형식을 추가하고 있는데, 이는 듀얼 이슈 VALU(Vector Arithmetic Logic Unit; 셰이더 유닛)와 보다 원활하게 연동되도록 설계되었습니다. 이 덕분에 명령어에 대한 제약이 완화되어 컴파일러가 듀얼 이슈 실행을 활용하기가 더 쉬워질 것입니다.
기술적인 관점에서 볼 때, 기존 시스템인 VOPD는 주로 단순한 2-피연산자(2-operand) 명령어와만 작동했기 때문에, 컴파일러가 호환되는 명령어 쌍을 스케줄링하기 어려웠습니다. VOPD3는 이를 3-피연산자(3-operand) 명령어까지 확장하여, 융합 곱셈-덧셈(fused multiply-add, FMA)과 같은 연산도 지원할 수 있게 합니다. 실제로, V_FMA_F32가 이번 풀 리퀘스트에 추가되었으며, 이를 통해 RDNA 5에 탑재될 것임을 유추할 수 있습니다.
이러한 변화는 듀얼 이슈 실행이 더욱 자주 발생할 수 있게 하여, FP32 처리량에 잠재적으로 막대한 증가를 가져올 수 있습니다(특정 경우에). 셰이더 유닛은 클럭 사이클을 기다리는 시간이 줄어들고 대신 더 많은 작업을 처리하게 되어, 각 명령어의 효율성이 높아집니다. 이는 렌더링과 같은 까다로운 시나리오에 도움을 주며, 결과적으로 게임 엔진이 듀얼 이슈 VALU를 염두에 두고 최적화할 수 있게 됩니다.

페어링 실패로 인해 제한되는 사례를 줄이는 것은 실리콘 차원에서 IPC를 억지로 끌어올리는 방식이 아닌, 하드웨어 자체의 효율성을 높이는 핵심 단계입니다. FMA 명령어는 신경 렌더링(neural rendering)과 관련하여 중요하기 때문에, 하드웨어의 성능 자체가 향상되지 않더라도 업스케일링 및 프레임 생성 기술과 같은 분야가 수혜를 입을 수 있습니다. 이는 듀얼 이슈 실행 자체가 효율성을 개선하기 때문입니다.
더 자세한 정보는 상단에 연결된 Coelacanth's Dream 기사를 참고할 수 있지만, 내용은 매우 밀도가 높다는 점에 유의하시기 바랍니다. 게다가, RDNA 5는 아직 먼 미래의 기술이며, 코어 수 증대와 같은 소비자 대상 업데이트가 훨씬 더 시장성 높은 특징일 것입니다. 그럼에도 불구하고, GPU가 명시된 FP32 처리량에 더 쉽게, 그리고 더 일관되게 도달할 수 있다는 점은 대단한 아키텍처적 성과입니다.
Tom's Hardware를 Google News에서 팔로우하거나 즐겨찾는 출처로 추가하여 최신 뉴스, 분석 및 리뷰를 받아보세요.