• Nvidia, GTC 2026에서 BlueField-4 STX 스토리지 아키텍처를 통한 에이전트형 AI 출시

    8개 클라우드 제공업체가 조기 채택에 참여하기로 했습니다.

    article image

    엔비디아는 2026년 3월 16일 GTC에서 블루필드-4 STX(BlueField-4 STX)를 발표했습니다. 이는 에이전트형 AI 추론 과정에서 발생하는 데이터 접근 병목 현상을 해결하기 위해 설계된 모듈식 레퍼런스 아키텍처 기반의 가속 스토리지 솔루션입니다.

    새로운 스토리지 최적화 블루필드-4 DPU(DPU)와 ConnectX-9 SuperNIC를 중심으로 구축된 이 플랫폼은, 확장된 세션과 증가하는 컨텍스트 창을 통해 작동하는 AI 에이전트가 기존 스토리지 경로의 처리량 한계를 초과할 때 발생하는 GPU 활용도 저하 문제를 해결하는 것을 목표로 합니다. 엔비디아에 따르면 STX는 기존 CPU 기반 스토리지 아키텍처 대비 최대 5배의 토큰 처리량, 4배 향상된 에너지 효율성, 그리고 2배 높은 페이지 인제스트 속도를 제공합니다.

    STX가 해결하고자 하는 핵심 기술적 문제는 KV 캐시(KV cache) 관리입니다. 트랜스포머 추론 과정에서 어텐션 메커니즘은 컨텍스트 내 모든 토큰에 대해 KV 쌍을 계산하며, 이 데이터는 각 후속 생성 단계마다 저장되고 검색되어야 합니다. 그러나 컨텍스트 창이 수십만 개의 토큰으로 급증하면서, KV 캐시가 GPU HBM(High Bandwidth Memory) 용량을 초과하는 상황이 발생합니다. 일반적인 대안은 호스트 DRAM 또는 NVMe 스토리지로 오프로드하는 것이지만, 이 두 경로는 모두 CPU를 통과해야 하므로, 컨텍스트 길이와 함께 누적되는 지연 시간(latency)을 유발하며 데이터 전송 과정에서 GPU 실행을 중단시키는 문제가 발생합니다.

    STX는 RDMA over Spectrum-X 이더넷을 통해 전용 가속 스토리지 레이어로 데이터를 라우팅함으로써 호스트 CPU의 개입을 우회합니다. 블루필드-4는 NVMe SSD를 직접 관리하며, KV 캐시에 대한 데이터 무결성 및 암호화 기능을 처리함으로써, 컨텍스트 데이터를 호스트가 아닌 스토리지 프로세서에서 직접 접근 가능하게 유지합니다. 전체 스택은 Vera Rubin 플랫폼에서 구동되며, 3월 16일 GTC에서 발표된 Vera CPU, ConnectX-9, Spectrum-X 이더넷, DOCA 소프트웨어, AI Enterprise 소프트웨어를 통합합니다. STX 기반으로 구축된 첫 번째 랙 규모의 구현체는 엔비디아 CMX 컨텍스트 메모리 스토리지 플랫폼입니다.

    article image

    STX 기반 시스템을 공동 설계하는 스토리지 및 인프라 공급업체로는 DDN, Dell Technologies, HPE, IBM, NetApp, VAST Data가 있으며, 제조 파트너로는 AIC, Supermicro, Quanta Cloud Technology가 참여합니다. 또한, CoreWeave, Lambda, Mistral AI, Oracle Cloud Infrastructure 등 8개 클라우드 및 AI 서비스 제공업체는 컨텍스트 메모리 스토리지의 조기 채택을 약속했습니다. STX 기반 플랫폼은 2026년 하반기에 파트너사들로부터 순차적으로 출시될 예정입니다.

    엔비디아의 창립자이자 CEO인 젠슨 황은 GTC에서 "에이전트형 AI는 소프트웨어의 정의 자체를 재정의하고 있으며, 그 배후의 컴퓨팅 인프라 또한 속도를 맞추기 위해 근본적으로 재창조되어야 한다"고 강조했습니다. 이어 "방대한 컨텍스트에 걸쳐 추론하고 지속적으로 학습하는 AI 시스템은 새로운 클래스의 스토리지를 요구한다"고 덧붙였습니다.

    Tom's Hardware를 구글 뉴스에서 팔로우하거나 즐겨찾기 출처로 추가하여 최신 뉴스, 분석 및 리뷰를 피드에서 받아보세요.

    [출처:] https://www.tomshardware.com/tech-industry/nvidia-launches-bluefield-4-stx-storage-architecture-for-agentic-ai