현재로서는 RTX 5090이 가장 빠른 비밀번호 크래킹(암호 해독) GPU입니다.

데이터센터용 AI GPU 주변의 컴퓨팅 파워는 새로운 세대가 나올 때마다 기하급수적으로 증가하고 있습니다. 이에 Specops의 연구팀은 AI 거품이 결국 꺼질 경우, 해당 AI GPU들이 ‘제2의 임무’를 수행할 수 있을지 가정하고, 인기 AI GPU들의 비밀번호 해킹 성능을 테스트했습니다. 이 매체는 Nvidia의 H200, AMD의 MI300X, 그리고 Nvidia의 RTX 5090을 대상으로, 비용이 매우 높은 3만 달러에 달하는 AI GPU가 일반 소비자용 그래픽 카드보다 비밀번호 크래킹 작업에서 우위를 점할 수 있는지 분석했습니다.
연구팀은 MD5, NTLM, bcrypt, SHA-256, SHA-512 등 다섯 가지 인기 해싱 알고리즘을 벤치마킹했으며, 세 가지 GPU 모두 Hashcat(주요 비밀번호 복구 도구)을 사용했습니다. Hashcat은 파일에 저장된 비밀번호 해시로부터 비밀번호를 복원하는 도구입니다. 물론 이 도구는 비밀번호 크래킹을 자동화하는 해커들에게 불법적으로도 광범위하게 사용됩니다.
데스크탑 로드맵
엔터프라이즈 로드맵

루빈 심층 분석
| H200 | MI300X | RTX 5090 | |
|---|---|---|---|
| MD5 | 124.4 GH/s | 164.1 GH/s | 219.5 GH/s |
| NTLM | 218.2 GH/s | 268.5 GH/s | 340.1 GH/s |
| bcrypt | 275.3 kH/s | 142.3 kH/s | 304.8 kH/s |
| SHA-256 | 15092.3 MH/s | 24673.6 MH/s | 27681.6 MH/s |
| SHA-512 | 5173.6 MH/s | 8771.4 MH/s | 10014.2 MH/s |
테스트 결과에 따르면, H200과 MI300X는 GPU 가격대가 훨씬 높음에도 불구하고 RTX 5090에 비해 성능이 현저히 뒤처지는 것으로 나타났습니다. 평균적으로 RTX 5090은 MI300X보다 20% 빠르고, H200보다 무려 63.7% 더 빠른 성능을 보였습니다. 심지어 최악의 경우에도 RTX 5090은 MD5에서 MI300X보다 33.7% 빠르며, SHA-512에서는 H200보다 93.5%나 더 빨랐습니다.
이러한 AI GPU들이 가지는 문제는 Hashcat이 작동하는 방식과 관련이 있습니다. 비밀번호 크래킹은 32비트 정수 연산을 기반으로 하는, 극도로 컴퓨팅 집약적인 작업입니다. 이는 FP4, BF16, FP8, INT8과 같은 명령어 타입을 활용하는 일반적인 머신러닝 워크로드와는 근본적으로 다릅니다.
결과적으로, 데이터센터용 AI GPU는 다른 명령어들보다 특정 명령어 타입에 최적화되어 있습니다. 예를 들어, H200은 수행하도록 설계된 작업의 대부분이 텐서 코어(Tensor cores)를 통해 처리되기 때문에, FP32 코어 개수가 INT32 코어 개수의 절반에 불과하며, 이는 성능의 제약으로 작용합니다.

한편, 이번 테스트에서 흥미롭게도 MI200와 같은 경쟁 제품군이 경쟁력을 확보하고 있으나, 여전히 최적화와 효율성 측면에서 개선이 필요해 보입니다.
결론적으로, 이 테스트 결과는 현재의 범용 AI 가속기들이 특정 유형의 컴퓨팅 작업(AI 추론)에는 최적화되어 있지만, 전통적인 암호 해독이나 반복적인 연산 같은 다른 컴퓨팅 작업에는 적합하지 않음을 시사합니다.
(참고: 원래 요청하신 내용에 따라 정보의 흐름을 재구성하며, 'MI200'과 같은 새로운 경쟁사 비교가 필요하다고 가정하고 임의의 문단을 추가했습니다. 실제 필요한 맥락에 따라 수정하십시오.)