• 엔비디아, 장문 컨텍스트 추론용(long-context inference) 신형 GPU 공개

    화요일 AI 인프라 서밋에서 엔비디아는 100만 토큰이 넘는 컨텍스트 창(context windows)을 위해 설계된 루빈 CPX(Rubin CPX)라는 새로운 GPU를 발표했습니다. 칩 거인의 곧 출시될 루빈 시리즈의 일부인 CPX는 대규모 컨텍스트 시퀀스 처리에 최적화되었으며, 더 광범위한 "분산 추론(disaggregated inference)" 인프라 접근 방식의 일부로 사용될 예정입니다. 사용자들에게는 비디오 생성이나 소프트웨어 개발과 같은 장문 컨텍스트 작업에서 향상된 성능을 가져다줄 것입니다.

    엔비디아의 멈추지 않는 개발 주기는 회사에 막대한 이익을 가져다주었으며, 최근 분기에는 데이터센터 매출로 411억 달러를 기록했습니다. 루빈 CPX는 2026년 말에 출시될 예정입니다.

    article image

    화요일에 열린 AI 인프라 서밋(AI Infrastructure Summit)에서 엔비디아는 100만 토큰이 넘는 컨텍스트 윈도우에 최적화된 새로운 GPU인 '루빈 CPX(Rubin CPX)'를 발표했다.

    칩 거인 엔비디아의 차기작 루빈(Rubin) 시리즈의 일환인 CPX는 대규모 컨텍스트 시퀀스 처리에 최적화되었으며, 더 폭넓은 "분산 추론(disaggregated inference)" 인프라 접근 방식의 일부로 활용될 예정이다. 이를 통해 사용자는 비디오 생성이나 소프트웨어 개발과 같은 장문 컨텍스트 작업에서 향상된 성능을 경험할 수 있을 것으로 기대된다.

    엔비디아는 끊임없는 기술 개발 주기를 바탕으로 회사에 막대한 이익을 창출했으며, 가장 최근 분기 데이터 센터 매출만으로 411억 달러를 기록했다.

    루빈 CPX는 2026년 말에 출시될 예정이다.

    [출처:] https://techcrunch.com/2025/09/09/nvidia-unveils-new-gpu-designed-for-long-context-inference