메타의 V-JEPA 2 모델, AI에게 주변 환경 이해 능력을 학습시키다

sw_reporter

메타(Meta)는 수요일에 새로운 AI 모델인 V-JEPA 2를 공개했습니다. 이 모델은 '세계 모델(world model)'로, AI 에이전트가 주변 환경을 이해하도록 설계되었습니다.

V-JEPA 2는 메타가 작년에 공개한 V-JEPA 모델의 확장판입니다. V-JEPA는 100만 시간 이상의 비디오 데이터를 학습했으며, 이 데이터는 로봇이나 다른 AI 에이전트가 물리적 세계에서 작동할 때, 중력과 같은 개념이 순차적인 사건에 미칠 영향을 이해하고 예측하는 데 도움을 줍니다.

이러한 능력은 영유아나 동물이 뇌를 발달시키면서 습득하는 상식적 연결성과 같습니다. 예를 들어, 개와 공놀이를 할 때, 개는 (바라건대) 공을 바닥에 튕기는 동작이 어떻게 반사적으로 위로 튀어 오를지, 또는 공이 현재 있는 위치가 아니라 떨어질 것으로 예측하는 방향으로 달려가야 한다는 것을 이해하게 될 것입니다.

메타는 로봇이 접시와 뒤집개를 들고 삶은 달걀이 있는 스토브 쪽으로 이동하는 상황을 예시로 들었습니다. 이 AI는 가장 가능성이 높은 다음 행동이 뒤집개를 사용해 달걀을 접시로 옮기는 것일 것이라고 예측할 수 있습니다.

메타에 따르면, V-JEPA 2는 물리적 세계와 관련된 지능을 향상시키려는 엔비디아(Nvidia)의 모델보다 30배 빠릅니다. 다만, 메타가 엔비디아와는 다른 벤치마크를 적용하여 자체 모델을 평가하고 있을 가능성도 제기됩니다.

메타의 최고 AI 과학자인 얀 르쿤(Yann LeCun)은 비디오 인터뷰에서 "우리는 세계 모델이 로봇공학에 새로운 시대를 열 것이라 믿는다. 이를 통해 실제 세계 AI 에이전트들이 막대한 양의 로봇 학습 데이터 없이도 가사 및 물리적 작업을 수행하는 데 도움을 줄 수 있게 될 것"이라고 설명했습니다.

[출처:] https://techcrunch.com/2025/06/11/metas-v-jepa-2-model-teaches-ai-to-understand-its-surroundings