GB202는 거대한 크기임에도 불구하고 Hopper 및 Volta의 플래그십 GPU 다이보다 눈에 띄게 작다.

Nvidia의 플래그십 제품인 RTX 5090에 사용되는 GB202 다이의 다이어그램이 X에 공개되면서, Blackwell 아키텍처의 구성 요소 배치가 밝혀졌습니다. Kurnal이 주석을 단 이 이미지는 L2 캐시, GPC(Graphics Processing Clusters), SM(Streaming Multiprocessors), 메모리 컨트롤러 등 GB202의 주요 구성 요소 배치를 보여줍니다. 또한, Nvidia의 이전 세대 플래그십인 RTX 4090에 사용된 AD102와 GB202를 비교한 두 번째 이미지도 함께 공유되었습니다.
GB202 다이샷을 분석하면, L2 캐시는 다이의 중앙에 직접 위치하며 여러 2MB 청크로 분할되어 두 개의 32MB 레이어를 형성하고 있습니다. 이 전체 L2 캐시 풀을 둘러싸고는 12개의 그래픽 처리 클러스터가 배치되어 있습니다. 각 클러스터 내부에는 정점 쉐이딩(vertex shading), 텍스처 매핑(texture mapping), 래스터화(rasterization)를 담당하는 여러 텍스처 처리 클러스터(TPC)가 자리 잡고 있습니다. 각 TPC 내부에는 GPU의 CUDA 코어 및 L1 캐시 같은 구성 요소를 포함하는 여러 스트리밍 프로세서가 존재합니다. 전체적으로 96개의 TPC가 확인되며, 각 TPC는 최대 네 개의 SM을 갖는 것으로 알려져 있습니다.
L2 캐시를 경계로 하여 12개의 래스터 엔진/3D FF(Framebuffer) 블록이 위치하며, 이 블록들은 폴리곤과 같은 장면의 기하학적 표현을 스크린에서 시각화 가능한 이미지로 변환하는 역할을 합니다. GB202 다이의 정중앙(상단에서 하단으로)에는 고효율 비디오 재생 및 녹화를 전담하는 Nvidia 비디오 인코더 및 디코더(NVDEC 및 NVENC)가 배치되어 있습니다.
GPU 디컴프레션을 통한 DirectStorage 테스트 — Blackwell GPU가 우위에 있을까?
GB202 Dieshot/5090 Dieshot 감사합니다 @ASUS Tony 俞元麟 by Chip@万扯淡 by Dieshot@Kurnal salts LayoutPhoto1 GB202 DieshotPhoto2 AD102 vs GB202 전체 픽셀 사진 Kurnal의 텔레그램 팀에 참여해주세요 https://t.co/MI6oCa2yOA pic.twitter.com/pny7bvCs5j 2025년 1월 25일
L2 캐시의 좌우로는 8개의 64비트 메모리 컨트롤러가 있으며, 다이의 상단, 좌측, 우측을 따라 GPU를 GDDR7 메모리 모듈에 연결하는 32비트 GDDR7 물리적 인터페이스가 자리 잡고 있습니다. 마지막으로, PCIe 5.0 x16 물리적 인터페이스와 디스플레이 컨트롤러가 다이의 하단에 위치합니다.
두 번째 이미지를 통해 GB202가 Ada Lovelace 대비 얼마나 큰 크기인지 명확히 알 수 있습니다. GB202는 AD102보다 24% 더 커서 761.56mm²의 다이 크기를 자랑하며, AD102는 616mm²입니다. Blackwell은 Ada Lovelace에 사용된 N4의 개량 버전인 TSMC의 N4P 노드를 기반으로 하므로, Nvidia가 GB202의 물리적 크기를 AD102보다 크게 늘린 것은 자연스러운 추론입니다. 다만, 만약 Nvidia가 TSMC의 최첨단 3N 노드를 사용했다면, Blackwell 칩은 Ada Lovelace 칩과 유사한 크기를 가지면서도 동일한 성능 특성을 유지할 수 있었을 것이나, 이는 확인되지 않았습니다.
그럼에도 불구하고, GB202가 Nvidia가 생산한 가장 큰 다이는 아닙니다. 여전히 구형 아키텍처인 Hopper 및 Volta에 속합니다. GH100과 GV100(Titan V 구동)은 각각 814mm² 및 815mm²의 다이 크기를 특징으로 합니다.