• Microsoft가 최신 DirectX SDK에 셰이더 실행 순서 재배열(SER)을 추가하여 레이 트레이싱 효율성을 높였다 — Intel Arc B 시리즈 GPU, 90% 성능 향상 입증

    레이 트레이싱이 더욱 스마트해지다.

    article image

    2022년 Nvidia는 레이 트레이싱의 부하를 줄이기 위해 RTX 40 시리즈 GPU와 함께 하드웨어 레벨의 Shader Execution Reordering(SER)을 도입했습니다. 이제 이 기술은 새로운 DirectX Agility SDK(버전 1.619)에 포함된 DXR 1.2의 공식적인 부분이 되었습니다. 첨부된 발표 블로그는 전문적인 기술 용어로 가득 차 있어 가볍게 읽기 어렵기 때문에, 이 기능이 실제로 무엇을 의미하며 어떻게 성능을 개선하는지 자세히 설명드리겠습니다.

    Desktop Roadmap

    Enterprise Roadmap

    article image

    Rubin 심층 분석

    SER의 기본 원리는 매우 높은 강도의 레이 트레이싱 또는 패스 트레이싱 장면에서 픽셀당 렌더링 시간을 줄여주는 것입니다. 예측 불가능성은 GPU에게 최악의 악몽에 가까운데, 광선이 표면에서 통제되지 않은 방식으로 반사될 경우, 물론 장면은 시각적으로 멋지지만 실리콘 자원을 마비시키게 됩니다. 바로 이 지점에서 SER이 작동하여 모든 반사 및 광선 반사 과정을 동적으로 분류하고 응집력(cohesion)을 형성합니다.

    SER은 GPU가 광선 전체에 걸쳐 패턴을 파악하고 이를 그룹화함으로써 더 효율적인 병렬 처리를 가능하게 합니다. SER은 DXR 1.2에 포함된 또 다른 핵심 기능인 Opacity Micromaps(OMMs)와 상호 작용합니다. OMM은 투명하거나 반투명한 표면에 닿았을 때 셰이더 실행을 건너뛰도록 GPU에 정확히 알려주어 처리 능력을 절약합니다.

    article image

    Nvidia는 OMM 덕분에 그래픽 카드가 보이는 픽셀에만 셰이딩을 적용할 수 있어, 패스 트레이싱에서 100만 배의 성능 향상을 약속했습니다. OMM은 어떤 부분이 불투명해야 하는지(그리고 그렇지 않은 부분은 무엇인지)에 대한 정확한 단서를 제공하기 때문입니다. 따라서 SER은 유사한 레이 트레이싱 셰이더들을 먼저 그룹화하고, OMM이 '보이지 않는' 셰이더 작업은 아예 생략하게 만듭니다. 불필요한 셰이더 작업을 줄인다는 것은 복잡한 장면의 게임에서 더 높은 프레임(FPS)을 유지할 수 있다는 의미입니다.

    Microsoft는 별도의 블로그에서 SER에 대한 자체 데모를 공개했는데, SER 사용 전후의 장면 렌더링 결과를 비교 보여줍니다. SER 적용 시 Nvidia GPU의 성능은 40% 향상된 반면, 일부 Intel Arc B 시리즈 GPU는 최대 90%까지 FPS가 증가했습니다. 이 기능이 표준화됨에 따라, 향후 Intel과 AMD가 차세대 GPU에 자체 하드웨어 레벨 SER을 구현할 가능성이 커졌습니다.

    article image

    이 SDK 업데이트에서 주목할 만한 마지막 추가 기능은 Shader Model 6.9입니다. 이 기능이 개발자들이 OMM과 SER 모두와 인터페이스할 수 있도록 실제로 가능하게 하는 핵심 요소입니다. 이는 게임 개발자들에게 매우 큰 기쁜 소식이지만, 결국 플레이어에게 실제로 적용되는 업그레이드는 개발자들이 이 기능을 구현하는 여부에 달려 있습니다. 명확히 하자면, 이 기능들은 작년에 발표되었지만, 오늘 막 미리 보기(preview) 단계로 공개된 것입니다.

    블로그에는 우리가 다루지 않은 내용들도 많습니다. 예를 들어 Long Vector 지원, 16비트 부동 소수점 연산, 하드웨어 오버헤드를 간소화하기 위한 일반적인 변경 사항 등이 있습니다. 이 중 일부는 현재 12GB 미만의 VRAM에서도 어려움을 겪는 최적화가 미흡한 게임들을 겨냥하고 있습니다. 아직은 초기 단계의 프로그래머 중심적인 개선 사항들이지만, 곧 실제 사용자 체감 성능 향상으로 이어질 수 있습니다.

    Google News에서 Tom's Hardware를 팔로우하거나, 저희를 즐겨찾는 소스로 추가하여 최신 뉴스, 분석 및 리뷰를 받아보세요.

    [출처:] https://www.tomshardware.com/pc-components/gpus/microsoft-adds-shader-execution-reordering-ser-in-latest-directx-sdk-for-more-efficient-ray-tracing-intel-arc-b-series-gpus-show-90-percent-performance-uplift