
미래의 자율 시스템을 구축하기 위해서는, 때로 모델이 또 다른 모델을 필요로 합니다.
자율주행차, 물리적 환경을 조작하는 로봇, 또는 자율 건설 장비를 개발하는 회사들은 평가와 훈련을 위해 수천, 경우에 따라 수백만 시간에 달하는 비디오 데이터를 수집합니다.
문제는 이 방대한 비디오 데이터를 분류하고 목록화하는 작업이 이제 모든 영상을 수동으로 시청해야 하는 인간의 영역이 되었다는 점입니다. 아무리 빠른 감기 기능을 사용해도 근본적인 한계를 벗어날 수 없습니다.
NomadicML은 CEO Mustafa Bal과 CTO Varun Krishnan이 설립한 스타트업으로, 자사 차량군 데이터의 95%를 아카이브에 보관하고 있는 고객들의 난제를 해결하고자 합니다.
특히 가치가 가장 높은 데이터, 즉 발생 빈도가 극히 낮아 경험이 부족한 물리적 AI 모델을 혼란스럽게 만들 수 있는 '엣지 케이스(edge cases)'를 찾아내는 것은 더 어려운 과제입니다.
Nomadic은 다양한 비전-언어 모델(vision language models)을 활용하여 영상을 구조화되고 검색 가능한 데이터셋으로 변환하는 플랫폼을 통해 이 문제를 해결합니다. 이를 통해 고객들은 더욱 정교하게 차량군을 모니터링하고, 강화 학습(reinforcement learning)을 위한 고유 데이터셋을 생성하며, 개발 주기를 단축할 수 있습니다.
이 회사는 지난 화요일, 포스트 머니 기업가치(post-money valuation) 5,000만 달러를 기준으로 840만 달러의 시드 라운드를 유치했다고 발표했습니다. 이번 라운드는 TQ Ventures가 주도했으며 Pear VC와 Jeff Dean이 참여했습니다. 이 자금은 회사가 고객 기반을 확장하고 플랫폼을 지속적으로 개선하는 데 사용될 예정입니다. 또한 Nomadic은 지난달 Nvidia GTC 피치 콘테스트에서 1등 상을 수상하며 주목받았습니다.
하버드 대학교 컴퓨터 과학 학부 동문인 두 창립자는 Bal이 TechCrunch와의 인터뷰에서 "리프트(Lyft)나 스노우플레이크(Snowflake) 같은 회사에서 일하며 끊임없이 같은 기술적 난관에 부딪혔다"고 언급했습니다.
그는 "우리는 고객이 가진 영상, 즉 자체 자율주행차(AV)와 로봇을 움직이는 모든 것에 대한 통찰력을 제공하고 있습니다. 이것이야말로 무작위 데이터가 아니라, 자율 시스템 개발자들을 다음 단계로 이끄는 핵심 동력입니다"라고 강조했습니다.
예를 들어, 경찰관의 지시에 의해서만 빨간불을 통과할 수 있다는 AV의 이해도를 미세 조정하거나, 특정 유형의 다리 아래를 지나는 모든 사례를 분리해내는 것을 상상해 보십시오. Nomadic의 플랫폼은 이러한 사고(incident)들을 단순히 규정 준수(compliance purposes) 목적으로 식별하는 것을 넘어, 훈련 파이프라인에 직접 공급할 수 있게 해줍니다.
Zoox, Mitsubishi Electric, Natix Network, Zendar 같은 고객들은 이미 이 플랫폼을 활용하여 지능형 기계를 개발하고 있습니다. Zendar의 엔지니어링 부사장(VP of Engineering)인 Antonio Puglielli에 따르면, Nomadic의 도구는 아웃소싱이라는 대안보다 훨씬 빠르게 작업 규모를 확장할 수 있게 해주었으며, 그 도메인 전문성 자체가 경쟁사와의 차별점이라고 말했습니다.
이러한 모델 기반의 자동 주석 도구는 물리적 AI 분야의 핵심 워크플로우로 부상하고 있습니다. Scale, Kognic, Encord와 같은 기존 데이터 라벨링 회사들이 AI 도구를 개발하고 있으며, Nvidia 역시 이 문제를 해결할 수 있는 오픈 소스 모델 제품군을 출시했습니다.
Varun은 자신의 회사가 단순한 라벨러를 넘어선 "에이전트적 추론 시스템(agentic reasoning system)"이라고 주장합니다. 즉, 사용자가 필요로 하는 바를 설명하면, 시스템이 스스로 최적의 방식으로 정보를 찾아내는 방식입니다. 이 시스템은 여러 모델을 활용해 발생하고 있는 행동을 이해하고 그 맥락을 설정합니다. Nomadic의 후원자들 역시 이 스타트업이 이러한 특정 인프라에 초점을 맞추는 전략으로 성공할 것으로 기대하고 있습니다.
라운드를 주도했던 TQ Ventures의 파트너 슈스터 탕거는 TechCrunch에 "소프트러스가 자체 클라우드를 구축하지 않는 이유와 넷플릭스가 자체 [콘텐츠 전송 시설]을 구축하지 않는 이유가 같습니다. 자율 주행 분야에서 마찬가지입니다. 핵심은 이 '무엇'을 구축하는지가 아니라, 이 '무엇'을 효율적으로 사용하는 데 있습니다."라고 말했습니다.
현재의 난제는 데이터가 아닌, 그 데이터를 처리하는 '지능화된 방식'에 있습니다.
현재까지의 기술은 이처럼 복합적인 데이터를 취합하고 해석하는 '지능화된 처리 방식'에 초점을 맞추고 있습니다.
노력의 결과로, 이처럼 복합적인 데이터를 취합하고 해석하는 '지능화된 처리 방식'을 통해 난제를 해결하고 있습니다.
[출처:] https://techcrunch.com/2026/03/31/nomadic-raises-8-4-million-to-wrangle-the-data-pouring-off-avs