• AMD, DeepSeek 벤치마크에서 RX 7900 XTX가 RTX 4090보다 우수하다고 주장

    엔비디아는 보통 AI 성능이 더 좋지만, 딥시크 AI를 통해 판도가 바뀌었다 (AMD 기준)

    article image

    AMD는 자사의 플래그십 GPU인 RX 7900 XTX의 벤치마크 결과를 Nvidia RTX 4090 및 RTX 4080 Super와 DeepSeek의 AI 모델을 활용하여 비교 분석한 결과를 공개했습니다. 다비드 맥카피(David McAfee)가 X(구 트위터)를 통해 전한 바에 따르면, RDNA3 기반의 이 GPU는 RTX 4090 대비 최대 13%, RTX 4080 Super 대비 최대 34% 높은 성능을 보였습니다.

    AMD는 DeepSeek R1을 이용하여 세 GPU 모델을 여러 LLM과 다양한 매개변수로 테스트했습니다. RX 7900 XTX는 DeepSeek R1 Distill Qwen 7B를 사용하여 RTX 4090을 가장 크게 앞질렀는데, 이 경우 Ada Lovelace GPU 대비 13%의 성능 향상을 기록했습니다. 또한 AMD는 RTX 4090을 상대로 세 가지 다른 LLM 구성을 테스트했습니다. RX 7900 XTX는 그중 두 구성에서 RX 4090을 능가했는데, Distill Llama 8B 사용 시에는 11% 빠르고, Distill Qwen 14B 사용 시에는 2% 빠른 결과가 나왔습니다. 반면, RX 4090은 Distill Qwen 32B를 사용하는 한 구성에서 RX 7900 XTX보다 4% 우세했습니다.

    DeepSeek이 @AMDRadeon 7900 XTX에서 뛰어난 성능을 보이고 있습니다. Radeon GPU 및 Ryzen AI APU에서 실행하는 방법은 여기를 참고하세요: https://t.co/FVLDLJ18Ov pic.twitter.com/5OKEkyJjh3 2025년 1월 29일

    AMD는 RTX 4080 Super를 상대로 세 가지 구성을 테스트했습니다. RX 7900 XTX는 DeepSeek R1 Distill Qwen 7B를 활용하여 RTX 4080 Super보다 34% 앞섰으며, 이 격차는 Distill Llama 8B 사용 시 27%로, Distill Qwen 14B 사용 시에는 22%로 감소했습니다.

    한편, Nvidia는 AI 기술 발전 덕분에 경로 추적(path tracing) 분야에서 100만 배의 향상을 약속하기도 했습니다.

    물론 이 모든 내용은 신중하게 받아들여야 합니다. 테스트가 AMD에 의해 진행되었기 때문에 (다시 한번) Nvidia GPU가 어떤 구성으로 테스트에 활용되었는지 확실하게 알 수 없기 때문입니다. 또한, 모든 AI 워크로드가 GPU의 전체 컴퓨팅 처리량을 100% 활용하는 것은 아닙니다. 저희의 Stable Diffusion 테스트에서 이러한 점이 명확했습니다. Stable Diffusion은 처리를 위해 FP8 계산이나 TensorRT 코드를 사용하지 않았습니다.

    RX 7900 XTX를 전용 AI 프로세서로 사용하는 것은 흔한 일은 아닙니다. 하지만 해당 아키텍처는 AI 워크로드를 처리할 충분한 역량을 갖추고 있습니다. RX 7900 XTX의 기반이 된 RDNA 3 아키텍처는 BF16 및 INT8을 지원하는 행렬 연산이 가능합니다. AMD는 RDNA 3에 공식적으로 "AI 가속기(AI Accelerator)"라는 명칭을 추가하며 이 GPU의 AI 처리 능력을 강조했습니다. RX 7900 XTX는 총 192개의 AI 가속기를 탑재하고 있습니다.

    최근 AMD는 고객들이 RX 7900 XTX를 포함한 호환 가능한 AMD 소비자 기반 하드웨어에서 DeepSeek R1을 구동하는 방법에 대한 튜토리얼을 발표했습니다. DeepSeek R1은 서방의 최첨단 AI 모델과 필적하는 성능을 제공하지만, 컴퓨팅 비용은 훨씬 낮은 신규 AI 모델입니다. DeepSeek R1은 Nvidia의 어셈블리 유사 PTX 프로그래밍 언어 활용을 포함한 다양한 하드웨어 기반 최적화를 통해 모델을 경쟁사보다 11배 빠르게 구동할 수 있게 합니다.

    [출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/amd-claims-rx-7900-xtx-outperforms-rtx-4090-in-deepseek-benchmarks