
구글 딥마인드는 화요일, 인터넷 연결 없이도 로봇에서 작업을 수행할 수 있는 'Gemini Robotics On-Device'라는 새로운 언어 모델을 출시했습니다. 이 모델은 지난 3월 발표된 회사의 이전 Gemini Robotics 모델을 기반으로 하여, 로봇의 움직임을 제어하는 기능을 제공합니다. 개발자들은 자연어 프롬프트(natural language prompts)를 활용해 이 모델을 다양한 목적에 맞게 제어하고 미세 조정(fine-tune)할 수 있습니다.
구글은 이번 벤치마크에서 Gemini Robotics On-Device가 클라우드 기반의 Gemini Robotics 모델과 유사한 수준의 성능을 보인다고 주장했습니다. 또한, 구체적인 모델명은 공개하지 않았으나, 일반적인 벤치마크 측면에서 다른 온디바이스 모델들보다 우위에 있다고 밝혔습니다.
시연에서 회사는 해당 로컬 모델을 구동한 로봇이 가방 지퍼 열기, 옷 접기 등 다양한 작업을 수행하는 모습을 보여주었습니다. 구글에 따르면, 이 모델은 원래 ALOHA 로봇을 위해 훈련되었으나, 이후 비팔(bi-arm) Franka FR3 로봇과 Apptronik의 아폴로(Apollo) 휴머노이드 로봇에 적용되었습니다. 특히, 비팔 Franka FR3 로봇은 산업용 컨베이어 벨트 위 조립과 같이 이전에 "보지 못했던" 시나리오와 물체들까지 성공적으로 다룰 수 있음을 입증했습니다.
나아가 구글 딥마인드는 'Gemini Robotics SDK'도 함께 출시했습니다. 개발자들은 이 SDK를 통해 뮤조코(MuJoCo) 물리 시뮬레이터에서 로봇에게 새로운 작업을 가르치기 위해 50개에서 100개의 작업 시연을 보여줄 수 있습니다.
다른 AI 모델 개발사들 역시 로봇 공학 분야에 진출하고 있습니다. 엔비디아(Nvidia)는 휴머노이드를 위한 파운데이션 모델 생성 플랫폼을 구축하고 있으며, 허깅 페이스(Hugging Face)는 로봇 공학용 오픈 모델 및 데이터셋 개발은 물론 로봇 자체 개발에도 참여하고 있습니다. 또한, 미래에셋 계열 한국 스타트업 RLWRLD는 로봇을 위한 파운데이션 모델 개발에 주력하고 있습니다.
[출처:] https://techcrunch.com/2025/06/24/google-rolls-out-new-gemini-model-that-can-run-on-robots-locally