누가 맞는 것일까요?

AMD가 발표한 DeepSeek AI 벤치마크에서 Radeon RX 7900 XTX의 실적에 제동이 걸리자, 엔비디아는 반격에 나섰다. 엔비디아는 자사 RTX 5090 및 RTX 4090 GPU가 RDNA 3 플래그십 모델 대비 현저히 빠르다고 주장하며, 엔비디아 블로그 게시물에서는 RTX 5090이 RX 7900 XTX보다 최대 2.2배 빠다고 역설했다.
엔비디아는 Distill Qwen 7b, Llama 8b, Qwen 32b 세 가지 DeepSeek R1 AI 모델 버전을 활용하여 RTX 5090, RTX 4090, RX 7900 XTX의 벤치마크를 수행했다. Qwen LLM과 32b 파라미터를 사용했을 때, RTX 5090은 RX 7900 XTX보다 124% 빠르며, RTX 4090은 47% 빠르다고 나타났다. Llama 8b를 사용했을 경우, RTX 5090은 RX 7900 XTX 대비 106% 성능 향상을 보였고, RTX 4090은 47% 더 빠르다. Qwen 7b를 사용했을 때는 RTX 5090이 103% 빠르고, RTX 4090은 RX 7900 XTX 대비 46% 우수한 성능을 기록했다.
한편, 엔비디아의 이러한 결과는 AMD가 자체적으로 제시한 RTX 4090 및 RTX 4080 기반의 벤치마크 결과와도 대비된다. AMD에 따르면, RX 7900 XTX는 단 한 가지 예외(RTX 4090 대비 몇 퍼센트 느린 경우)를 제외하고는 두 Ada Lovelace GPU보다 우위를 점했다. AMD는 RX 7900 XTX가 각각 RTX 4090 및 RTX 4080보다 최대 113%, 134% 더 빠르다고 밝힌 바 있다.
AI 발전으로 경로 추적(path tracing) 성능 100만 배 향상을 예고한 엔비디아

엔비디아는 RTX 4090을 통해 상당히 다른 시나리오를 제시하며, RTX 4090이 RX 7900 XTX보다 월등히 빠르며 역전된 상황임을 보여준다. 여기에 더해(엔비디아 측에) RTX 5090은 RTX 4090의 성능을 두 배 이상 달성하며 RX 7900 XTX를 완벽하게 압도하는 결과가 추가되었다.
이는 제조사들이 제공하는 벤치마크 결과는 비판적인 시각으로 접근해야 함을 시사한다. 엔비디아의 결과 자체가 오류일 수 있지만, 어쨌든 AMD와 엔비디아가 서로 모순되는 결과를 내놓고 있다.
한편, DeepSeek R1은 현업계에 큰 반향을 일으킨 새로운 AI 모델로, 현재 최고 성능의 AI 모델들과 경쟁할 만한 성능을 제공함에도 불구하고 컴퓨팅 파워를 11분의 1 수준으로만 요구한다는 점에서 주목받고 있다. 이 DeepSeek의 혁신적인 성과는 단 하루 만에 엔비디아가 약 6,000억 달러의 시가총액 손실을 입는 원인이 되기도 했다.