• 엔비디아의 RTX 5090과 5080이 RTX 4090 및 4080과 동일한 SM당 L1 캐시 크기를 가질 것이라는 보도

    RTX 5090은 L2 캐시가 36% 더 커졌지만, RTX 5080은 이전 모델 대비 고작 1MB만 L2 캐시가 늘어났다.

    article image

    Nvidia의 신형 RTX 5090과 RTX 5080의 L1 및 L2 캐시 사양이 공개되었습니다. HardwareLuxx에 따르면, RTX 5090과 5080은 4090 및 4080과 동일한 SM당 L1 캐시 용량을 유지하는 것으로 알려졌으며, 특히 5090은 이전 세대 대비 36% 더 많은 L2 캐시 용량을 탑재합니다.

    L1 캐시 용량은 GB202 기반 칩에서 AD102와 마찬가지로 SM당 128KB 수준을 유지하는 것으로 보고되었습니다. 그 결과, RTX 5090은 총 21.7MB의 L1 캐시 용량을 갖게 됩니다. 이는 SM 수가 RTX 4090의 128개 대비 170개로 증가했기 때문에 가능하며, 덕분에 Blackwell GPU는 RTX 4090(16,384개)보다 많은 21,760개의 CUDA 코어에 걸쳐 5.4MB 더 많은 L1 캐시를 확보했습니다.

    RTX 5080의 기반 다이인 GB203에서도 이와 같은 추세가 나타납니다. 다만, RTX 5080과 4080 사이의 SM 개수 차이가 비교적 작아, 두 GPU 모두 총 L1 캐시 용량이 거의 동일합니다. RTX 5080은 10.7MB의 L1 캐시를, RTX 4080은 9.7MB의 L1 캐시를 탑재하여 불과 1MB의 차이만을 보입니다.

    나머지 Blackwell 계열 다이들 역시 이러한 추세를 따를 것으로 예상됩니다. 실제로 Blackwell의 SM당 128KB L1 캐시 크기는 Ada Lovelace는 물론, Ampere 세대와도 정확하게 비교됩니다. 주목할 점은 Ampere가 Nvidia가 L1 캐시 용량을 SM당 업그레이드한 마지막 사례였으며, 당시 Turing 세대 대비 용량을 두 배로 늘렸다는 것입니다.

    RTX 5090은 L2 캐시 용량 면에서 RTX 4090 대비 36%의 개선을 이루어 약 100MB에 달하는 용량을 제공합니다. 반면, RTX 5080은 사실상 큰 업그레이드가 없어, RTX 4080 및 4080 Super와 비교했을 때 겨우 1MB가량 증가한 L2 캐시 용량을 가집니다.

    Blackwell의 캐시 용량 개선 폭은 상대적으로 미미하지만, 이는 L2 캐시 중심으로 Ampere가 Ada Lovelace에 비해 보여주었던 막대한 캐시 용량 증가와는 극명한 대조를 이룹니다. 예를 들어, RTX 4090은 RTX 3090 시리즈(6MB 대비 72MB) 대비 엄청난 캐시 용량 증가를 보여주었습니다.

    Blackwell의 낮은 캐시 개선폭을 보완하기 위해, RTX 50 시리즈 전반에 걸쳐 메모리 성능 향상을 위한 업그레이드가 이루어졌습니다. 이들은 28Gbps로 작동하는 GDDR7 메모리 모듈로 업그레이되지만, 5080 모델만 예외적으로 더욱 빠른 32Gbps 모듈을 채택합니다.

    또한, 일부 50 시리즈 모델은 메모리 성능을 추가적으로 향상시키기 위해 GDDR7 업그레이드 외에 버스 폭(bus-width) 업그레이드를 적용했습니다. RTX 5090은 512비트 메모리 버스를, RTX 5070 Ti는 256비트 메모리 버스를 탑재하며, 이는 각각 이전 세대인 RTX 4090과 RTX 4070 Ti/Super 대비 향상된 사양입니다. RTX 5080과 RTX 5070은 이전 세대와 동일한 버스 폭을 유지합니다.

    [출처:] https://www.tomshardware.com/pc-components/gpus/nvidias-rtx-5090-5080-reportedly-have-the-same-l1-cache-size-per-sm-compared-to-rtx-4090-4080