1,000개 이상의 타이틀에서 40,000시간의 게임 플레이 데이터로 훈련되었습니다.

Nvidia, 스탠퍼드, 칼텍 등 여러 기관의 연구진은 NitroGen을 선보였습니다. 지난 금요일 LinkedIn을 통해 Nvidia의 AI 디렉터이자 명예 과학자인 짐 팬(Jim Fan)은 NitroGen을 "1,000가지 이상의 게임을 플레이하도록 훈련된 오픈 소스 파운데이션 모델"이라 극찬했습니다. 하지만 그 의미는 단순히 게임 세계에 국한되지 않으며, 시뮬레이션 및 로봇공학 분야에 걸쳐 상당한 이점을 제공하며 현실 세계로까지 확장됩니다.
이 연구는 일종의 ‘행동을 위한 GPT(GPT for actions)’를 추출하려는 시도로 해석될 수 있습니다. 즉, 검증된 대규모 훈련 기술을 언어와 컴퓨터 비전 분야를 넘어 적용한 LLM(대규모 언어 모델)의 혁신적인 돌파구인 것입니다. 나아가 연구 논문 서론에서는 "알려지지 않은 환경에서 작동할 수 있는 범용적인 구현 에이전트(embodied agents)를 개발하는 것이 오랫동안 AI 연구의 성배(holy grail)로 여겨져 왔다"고 역설합니다.
흥미롭게도, NitroGen의 기반 아키텍처는 원래 로봇공학을 위해 설계된 GROOT N1.5입니다. 이 기술을 게임 환경에 적용한 사례는, 역으로 로봇이 다양하거나 예측 불가능한 환경에서 임무를 수행할 때 엄청난 이점을 가져올 잠재력을 시사합니다.

Nvidia, AI 발전을 통해 패스 트레이싱(path tracing) 능력을 100만 배 향상시킨다고 약속하다
NitroGen은 역학과 물리학이 매우 다양하게 얽혀 있는 게임 환경에 적응되도록 훈련되었습니다. 이것이 바로 비디오 게임의 본질이자 재미입니다. 연구진은 스트리머들이 공유한 40,000시간 이상의 공개 게임 플레이 영상을 활용했으며, 특히 게이머들이 실시간으로 게임패드를 조작하는 상호작용이 스트림에 오버레이된 영상이 큰 도움이 되었습니다.
팬에 따르면, 테스트 결과 NitroGen은 "RPG, 플랫폼 게임, 배틀 로얄, 레이싱, 2D, 3D 등 종류를 가리지 않는" 광범위한 게임에서 성공을 거두었습니다. 그 결과가 고무적임에도 불구하고, 해당 Nvidia 과학자는 이는 시작에 불과하며 아직 극복해야 할 큰 산이 남아 있다고 언급했습니다.

NitroGen의 초기 버전은 의도적으로 빠른 모터 제어 능력, 즉 팬이 부르는 '게이머 본능(gamer instinct)'에 중점을 두었습니다. 공유된 연구에 따르면, 이 새로운 LLM은 "다양한 영역에 걸쳐 강력한 역량"을 보여주며, 처음부터 학습된 모델과 비교했을 때 작업 성공률에서 52%의 상대적 개선을 보이는 절차적 생성 환경은 물론, 한 번도 접하지 못한 게임에서도 작동합니다.
지금까지 연구된 NitroGen 관련 내용은 모두 오픈 소스로 공개되었으며, 게임, 로봇공학, LLM에 관심 있는 사용자들에게는 직접 실험하고 활용해 보기를 적극 권장합니다. 사전 훈련된 모델 가중치, 전체 액션 데이터셋, 코드를 수정하는 것 모두 자유롭게 시도할 수 있습니다.
Google News에서 Tom's Hardware를 팔로우하거나 즐겨찾는 출처로 추가하여 최신 뉴스, 분석 및 리뷰를 피드에서 받아보세요.