
OpenAI의 4o부터 Stable Diffusion에 이르기까지, 텍스트 프롬프트만으로 사실적인 이미지를 생성하는 AI 기반 모델은 이제 흔해졌습니다. 반면, 텍스트 프롬프트만으로 완전하고 일관성 있는 3D 온라인 환경을 생성하는 기반 모델은 이제 막 등장하는 단계입니다.
하지만 이러한 모델이 상용화될지 여부의 문제가 아니라, '언제' 상용화될지의 문제입니다. 현재 유럽에서 가장 저명한 AI 3D 모델 연구원 중 한 명인 마티아스 니에스너(Matthias Niessner)는 뮌헨 공과대학교(Technical University of Munich)의 비주얼 컴퓨팅 및 AI 연구실에서 기업가적 휴직을 갖고 이 분야의 스타트업을 창업했습니다.
그 스타트업이 바로 SpAItial입니다.
과거 Synthesia의 공동 창업자로, 21억 달러로 평가받았던 사실적인 AI 아바타 스타트업 출신인 니에스너는 유럽 스타트업치고는 이례적으로 큰 규모인 1,300만 달러의 시드 라운드를 유치했습니다. 이 라운드는 저명한 유럽 초기 단계 투자사인 Earlybird Venture Capital이 주도했으며, Speedinvest와 여러 저명한 엔젤 투자자들의 참여가 있었습니다. (참고: Earlybird는 UiPath의 Digital East Fund, Peak Games 등을 지원한 바 있습니다.)
이 라운드 규모는 SpAItial이 현재 대중에게 공개할 만한 실체가 거의 없다는 점을 감안하면 더욱 인상적입니다. 현재까지 공개된 것은 텍스트 프롬프트가 어떻게 3D 공간을 생성할 수 있는지 보여주는 티저 비디오가 전부입니다.
하지만 니에스너가 구축한 기술팀이 있습니다. 리카르도 마르틴-브루알라(Ricardo Martin-Brualla)는 이전 구글의 3D 원격 회의 플랫폼(현재 Beam으로 불림)에서 근무했으며, 데이비드 노보트니(David Novotny)는 메타(Meta)에서 6년간 근무하며 회사의 텍스트-3D 에셋 생성 프로젝트를 이끌었습니다.
이들의 집단적 전문성은 이미 포토리얼리즘(photorealism)에 초점을 맞춘 경쟁사들이 존재하는 분야에서 그들에게 경쟁력을 제공할 것입니다. 2,700만 달러를 유치하여 엔터테인먼트 사용 사례를 목표로 하는 Odyssey가 있습니다. 하지만 AI 선구자인 Fei-Fei Li가 창립했으며 이미 10억 달러 이상의 가치 평가를 받은 회사도 존재합니다.
니에스너는 이를 다른 유형의 기반 모델들과 비교했을 때 여전히 경쟁이 적다고 평가하지만, 그가 자신과 팀원들이 추구하는 '더 큰 비전' 측면에서도 그렇다고 말했습니다.
그는 "단순히 3D 세계를 만들고 싶은 것이 아닙니다. 이 세계가 실제 세계처럼 작동하기를 바랍니다. 상호작용이 가능하고, 그 안에서 무언가를 할 수 있게 하기를 원합니다. 아직 아무도 이 부분에 도달하지 못했습니다."라고 설명했습니다.

SpAItial: 비디오 게임을 현실로
한편, 포토리얼리즘 3D 환경에 대한 수요 자체가 얼마나 클지는 아무도 아직 명확히 파악하지 못하고 있습니다. 디지털 트윈부터 증강 현실(AR)에 이르기까지 "1조 달러" 규모의 기회라는 약속은 벤처 투자사들의 흥미를 끌기에 충분하지만, 동시에 너무 모호하고 다면적이어서 구체적인 시장 진출 전략을 짜기 어렵게 만듭니다. 가장 명확한 사용 사례는 비디오 게임 제작이지만, 이 모델들은 엔터테인먼트, 건설에 사용되는 3D 시각화, 궁극적으로 로봇 훈련 같은 실생활 영역에서도 응용될 수 있습니다.
니에스너는 개발자들이 기반 모델을 라이선스하여 특정 용도의 다운스트림 애플리케이션을 개발하도록 유도함으로써 이러한 문제점을 해결하고자 합니다. 그는 또한 스탠퍼드 방문 조교수 시절의 룸메이트였던 전 Cazoo 임원 루크 로저스(Luke Rogers)를 비즈니스 부문 공동 창업자로 영입했습니다.
SpAItial의 로드맵상 첫 번째 과제는 초기 모델로 작업할 수 있는 파트너와 고품질 모델을 기다려야 할 파트너를 식별하는 것입니다.
니에스너는 "최소한 몇몇 파트너들과 협력하여, 이들이 API를 어떻게 활용할 수 있는지 확인하고 싶습니다."라고 말했습니다.
다른 자금력을 갖춘 AI 스타트업들과 비교했을 때, SpAItial은 매출 발생을 더욱 중요한 목표로 설정하고 있습니다. 하지만 이를 위해서는 먼저 컴퓨팅 자원과 인재 채용에 일정 부분 비용을 지출해야 합니다. 특히 인재 확보에 있어 회사는 양적 증가(quantity)보다 질적 우수성(quality)에 집중하고 있습니다. 니에스너에 따르면 "팀이 당장 수백 명으로 늘어날 계획은 없으며, 실제로 그럴 필요도 없습니다."
대신, 니에스너와 공동 창업자들은 유리컵이 사실적으로 깨지는 것과 같은, 더욱 크고 인터랙티브한 3D 공간을 생성하는 데 주력하고 있습니다. 이는 니에스너가 말하는 '성배(holy grail)'를 열어줄 것으로 여겨집니다. 즉, 10살짜리 아이가 텍스트만 입력하여 10분 만에 자신만의 비디오 게임을 만들 수 있게 하는 것입니다.
그의 관점에서 볼 때, 이러한 야심 찬 목표는 사용자가 3D 객체를 생성하는 것처럼 보이는 비교적 쉬운 목표('low-hanging fruit')보다 오히려 더 달성하기 쉬울 수 있습니다. 왜냐하면 대부분의 게임 플랫폼은 여전히 제3자가 추가할 수 있는 요소들을 강력하게 통제하고 있기 때문입니다. (물론, Roblox가 자체적으로 기능을 구축하기로 결정한다면 예외일 수 있습니다.) 하지만 그때가 되면 SpAItial은 이미 CAD(CAD)를 대체하는 일에 매진하고 있을지도 모릅니다. 3D 생성의 다음 장은 이제 막 시작되고 있는 것입니다.
참고: 본 기사는 Earlybird가 UiPath에 투자한 펀드를 명확히 하기 위해 수정되었습니다.