보스턴 다이내믹스와 도요타 리서치 연구소(TRI)는 수요일, AI 기반 로봇 지능을 전기 아틀라스(Atlas) 휴머노이드 로봇에 적용할 계획을 발표했다. 이번 협력은 TRI가 연구해 온 대형 행동 모델(LBMs)의 역량을 활용하는 것으로, 이는 ChatGPT와 같은 플랫폼을 구동하는 대규모 언어 모델(LLMs)과 유사하게 작동한다.
지난 9월 테크크런치(TechCrunch)는 TRI의 베이 에어리어 캠퍼스를 방문하여 로봇 학습에 대한 심층적인 내용을 취재했다. 지난해 디스럽트(Disrupt) 컨퍼런스에서 공개된 연구에 따르면, 연구소장 길 프랫(Gill Pratt)은 이 실험실이 야간 훈련만으로 팬케이크 뒤집기 같은 일상 가정 작업을 수행하는 로봇의 정확도를 90%까지 끌어올리는 데 성공했다고 설명했다.
프랫은 당시 다음과 같이 언급했다. "머신러닝 분야에서 얼마 전까지는 트레이드오프가 존재했습니다. 즉, 구현은 가능했지만 수백만 건의 훈련 사례가 필수적이었죠. 물리적 작업의 경우 그런 많은 데이터를 확보할 시간이 부족해서, 1만 건에 도달하기도 전에 장비가 고장나곤 했습니다. 하지만 이제는 수십 건으로도 충분한 것 같습니다. 수십 건이 필요한 이유는 훈련 데이터의 다양성을 확보해야 하기 때문이지만, 경우에 따라서는 그보다 적은 수로도 가능합니다."
하드웨어적 관점에서 볼 때, 보스턴 다이내믹스는 TRI와 매우 이상적인 파트너십을 이룬다. 스팟(Spot)을 제작한 이 회사는 자체 시스템에 동력을 공급하기 위해 소프트웨어 및 AI 분야에서 상당한 노력을 기울였지만, 로봇에게 완전한 자율성으로 복잡한 작업을 학습시키기 위해 필요한 작업 방식은 완전히 차원이 다른 영역이다.
보스턴 다이내믹스 CEO 로버트 플레이터(Robert Playter)는 성명에서 "로봇 공학 산업에 이보다 더 흥분되는 시기는 없었다. 우리는 일반 목적의 휴머노이드 개발을 가속화하기 위해 TRI와 협력하기를 기대한다"고 밝혔다. 그는 이어 "이번 파트너십은 강력한 연구개발 기반을 가진 두 회사가 결합하여 복잡한 난제에 도전하고, 현실 세계의 문제를 해결하는 유용한 로봇을 만드는 좋은 사례"라고 덧붙였다.
보스턴 다이내믹스는 작년 4월 전기 아틀라스의 설계를 공개하며, 이전 세대의 크고 유압식인 모델을 단종시켰다. 이후 로봇에 대한 영상은 거의 공개되지 않았으나, 8월 테크크런치는 로봇이 푸시업을 하는 짧은 영상을 입수하는 데 성공했다. 이 푸시업 시연은 아틀라스의 초기 영상과 마찬가지로 로봇의 놀라운 힘을 잘 보여주는 사례였다.
휴머노이드 로봇 분야의 주요 경쟁사로는 아길리티(Agility), 피규어(Figure), 테슬라(Tesla) 등이 있으며, 이들은 주로 자체적으로 AI 팀을 구축하는 방식을 선택해 왔다. 더욱이 보스턴 다이내믹스와 TRI의 협력은 두 기관이 모두 자동차 분야의 직접적인 경쟁사인 현대와 도요타의 영향을 받는다는 점에서 특히 주목할 만하다.
한편, 보스턴 다이내믹스는 자체 연구 스핀아웃사인 AI Institute(구 보스턴 다이내믹스 AI Institute)를 운영하고 있다. 이 연구소는 보스턴 다이내믹스의 창립자이자 전 CEO인 마크 라이버트(Marc Raibert)가 운영하며 독립성을 유지한다. 또한 비교적 조직이 젊어 아직 인력 구축 단계에 있다. 반면, TRI는 자체적으로 로봇 하드웨어 분야에 대한 투자를 줄여왔다.
이 모든 노력의 궁극적인 목표는 진정한 범용 기계(General-purpose machine)를 만드는 것이다. 즉, 인간이 수행할 수 있는 거의 모든 작업을 배우고 수행하며, 나아가 그 이상의 것도 할 수 있는 시스템이다. 로봇 하드웨어 자체가 그런 수준의 정교함에 근접하는 모습은 이미 목격되었지만, 범용 지능(AGI)에 도달하는 것은 훨씬 더 어려운 과제다.
물론, 시스템용 SDK의 등장은 보스턴 다이내믹스의 스팟과 같은 로봇이 수행할 수 있는 작업의 폭을 극적으로 넓히는 데 기여했다. 하지만 진정한 인공 일반 지능(AGI)에 도달하는 것은 — 그 가능성 여부와는 별개로 — 아직 먼 미래의 이야기다.