• Geekbench, 인텔 iBOT으로 최대 30% 향상 조사… 성능 향상, 새로 벡터화된 명령어에 기인

    iBOT이 물밑에서 상당한 움직임을 보이자, Geekbench는 비판적인 반응을 내놓고 있다.

    article image

    인텔 Core Ultra 7 270K Plus와 Core Ultra 5 250K Plus에 대한 리뷰가 발표된 지 며칠 후, Geekbench는 이 두 CPU로 기록된 모든 결과가 무효화될 것이라고 밝혔습니다. 그 이유는 현재 Intel Binary Optimization Tool (iBOT)을 지원하는 유일한 비(非)게이밍 애플리케이션이 존재하는 데서 비롯되는데, iBOT은 특정 인텔 아키텍처에 맞춰 바이너리를 최적화하는 도구입니다. 일주일 뒤, Geekbench는 iBOT이 백그라운드에서 구체적으로 어떤 작업을 수행하는지 조사한 내용을 발표했으며, 특정 워크로드에서 최대 30%의 성능 향상이 새로 벡터화된 명령어 덕분임을 분석했습니다.

    DLSS를 활용한 CPU 스케일링

    전반적으로 Geekbench는 MSI Prestige 16 AI+에 버전 6.3을 적용하고 Intel Core Ultra 9 386H로 테스트했을 때, 싱글 및 멀티 스레드 성능 모두 5.5%의 증가를 발견했습니다. 이 결과는 270K Plus 및 250K Plus로 iBOT을 테스트했을 때 관찰된 결과와 큰 차이가 없었습니다. Geekbench의 여러 하위 테스트에서는 성능 개선 폭이 미미했으나, 객체 제거(object removal)의 경우 24.6%, HDR 처리의 경우 28.5% 등 성능이 두드러지게 향상된 테스트도 포착했습니다. 이에 Geekbench는 무엇이 발생했는지 더 깊이 파악하기 위해 HDR 하위 테스트에 집중했습니다.

    article image

    iBOT을 활성화했을 때, Geekbench는 전체 명령어(overall instructions)가 14% 감소하고 스칼라 명령어(scalar instructions)가 62% 감소하는 것을 확인했습니다. 반면, 벡터 명령어(vector instructions)는 1,366%나 급증했습니다. 어떤 명령어들이 실제로 실행되는지 확인하기 위해 Geekbench는 인텔의 소프트웨어 개발 에뮬레이터(Software Development Emulator, SDE)를 활용했습니다.

    iBOT을 비활성화하고 HDR 하위 테스트를 100회 실행한 결과, Geekbench는 총 2,200억 개의 스칼라 명령어와 12.5억 개의 벡터 명령어를 기록했습니다. iBOT을 활성화한 상태에서는 이 수치가 스칼라 명령어 846억 개, 벡터 명령어 183억 개로 줄어들었습니다. iBOT은 이 하위 테스트의 방대한 명령어들을 벡터화함으로써, 스칼라 명령어의 선형 파이프라인(single instruction, single data, 또는 SISD)에 의존하기보다 SIMD(single instruction, multiple data) 방식을 활용하여 성능을 현저하게 향상시키는 것입니다.

    여기서 주목할 만한 점은 명령어 구성 자체의 변화입니다. Geekbench의 결론은 예상 가능한 바입니다. 즉, 소수의 애플리케이션에서만 적용되는 최적화는 높이 평가하지 않습니다. "iBOT은 이러한 다양한 코드를 프로세서에 최적화된, 완전히 최적화된 바이너리로 대체하여 변동성을 줄이고, 일반적인 성능보다는 최대 성능을 측정하기 때문입니다."

    article image

    Geekbench의 관점은 다소 부정적이며 그럴 만한 이유가 있지만, 내부를 깊이 들여다본 결과는 iBOT의 미래에 중요한 시사점을 던집니다. 현대 CPU 아키텍처에서 벡터화된 명령어는 전력 소모에 비해 상대적으로 적은 영향을 받으면서도 성능을 대폭 개선할 수 있습니다. Y-Cruncher와 같은 AVX-512 워크로드에서 Zen 5의 성능만 봐도 이를 알 수 있습니다. 이번 조사는 인텔이 출하된 바이너리 단에서 이를 성공적으로 구현할 수 있음을 보여줍니다.

    하지만 단점 또한 존재합니다. Geekbench는 초기 iBOT 테스트에서 40초의 시작 지연(startup delay)을 기록했다고 언급했는데, 이는 이후 반복 테스트에서는 일관된 2초 지연으로 줄어들었습니다. iBOT을 비활성화했을 때는 지연이 전혀 없었습니다. 또한, Geekbench는 Geekbench 6.7에서는 성능 개선을 발견하지 못했습니다. 이는 iBOT이 실행 파일에 대해 체크섬(checksum)을 계산하는 과정, 즉 특정 바이너리가 최적화되었는지 여부를 확인하는 과정에 기인합니다.

    Tom's Hardware를 Google News에서 팔로우하거나 선호 출처로 추가하여 최신 뉴스, 분석 및 리뷰를 피드에서 받아보세요.

    [출처:] https://www.tomshardware.com/pc-components/cpus/geekbench-investigates-up-to-30-percent-jump-with-intels-ibot-performance-gain-attributed-to-newly-vectorized-instructions