AI 비디오 생성 스타트업 루마(Luma)는 목요일 텍스트, 이미지, 비디오, 오디오 전반에 걸친 창작 전 과정을 처리하도록 설계된 '루마 에이전트(Luma Agents)'를 출시했다. 루마 에이전트는 단일 멀티모달 추론 시스템으로 훈련된 아키텍처를 기반으로, 루마가 자체 개발한 '유니파이드 인텔리전스(Unified Intelligence)' 모델군을 통해 구동된다.
루마 에이전트는 광고 에이전시, 마케팅팀, 디자인 스튜디오, 그리고 일반 기업을 위한 새로운 업무 방식 대안으로 제시되고 있다. 루마에 따르면, 해당 에이전트는 루마의 Ray 3.14, 구글의 Veo 3 및 Nano Banana Pro, 바이트댄스(ByteDance)의 Seedream, 엘레븐랩스(ElevenLabs) 음성 모델을 포함한 다양한 AI 모델들과 협력하면서 텍스트, 이미지, 비디오, 오디오 생성을 계획하고 수행할 수 있다.
루마의 에이전트는 스타트업의 유니파이드 인텔리전스 AI 모델군 중 가장 먼저 공개된 Uni-1 모델을 기반으로 구축되었다. 루마의 최고경영자 겸 공동창업자인 아밋 자인(Amit Jain)에 따르면, 이 모델은 오디오, 비디오, 이미지, 언어, 공간 추론 등 광범위한 영역에서 훈련되었다.
자인은 TechCrunch 인터뷰에서 Uni-1 모델이 "언어적으로 추론하며 생각하고, 이를 픽셀이나 이미지로 상상하고 구현할 수 있다... 저희는 이를 '픽셀 속 지능(intelligence in pixels)'이라고 부릅니다"라고 설명했다. 그는 오디오 및 비디오와 같은 다른 출력 기능들은 추후 모델 업데이트를 통해 제공될 것이라고 덧붙였다.
자인은 "우리 고객들은 단순한 도구를 사는 것이 아니라, 비즈니스 자체의 방식(how business is done)을 근본적으로 재정립하고 있습니다"라고 강조했다.
루마는 이미 글로벌 광고 에이전시인 Publicis Groupe 및 Serviceplan은 물론, 아디다스(Adidas), 마쓰다(Mazda), 사우디 AI 회사 휴메인(Humain)과 같은 브랜드를 포함한 기존 고객들에게 새로운 에이전트 플랫폼을 배포하기 시작했다.
자인은 루마 에이전트가 에셋, 협업자, 창작 반복 과정 전반에 걸쳐 지속적이고 일관된 맥락(persistent context)을 유지할 수 있기 때문에 혁신적이라고 평가했다. 또한, 이 에이전트들은 스스로 결과물을 평가하고 개선하는 '반복적인 자가 비평(self-critique)'을 통해 출력을 정교하게 다듬을 수 있다고 밝혔다.
자인은 이러한 '작업 자체를 점검하는 능력'이야말로 코딩 에이전트가 매우 유용하게 쓰이는 이유라고 설명했다. "작업물을 평가하고, 수정하며, 해결책이 최적이고 정확할 때까지 이 과정을 반복하는 능력이 필요합니다."
자인은 현재 창작 환경에서 AI 도구를 사용하는 작업 흐름은, 창작 업계 전문가들이 AI에 기대하는 폭발적인 효율성을 제공하지 못하고 있다고 지적했다. 그는 "현재는 '여기 100개의 모델이 있습니다. 사용법을 배우세요'와 같은 방식에 머물러 있다"고 비판했다.
그는 루마 에이전트의 차별점은 이미지나 아이디어 하나를 다듬기 위해 매번 사용자가 프롬프트를 주고받을 필요가 없다는 점이라고 강조했다. 대신 시스템이 사용자와의 대화를 통해 광범위한 변형 세트를 자동으로 생성하고, 사용자가 방향을 설정하도록 돕는다는 것이다.
자인은 "유니파이드 인텔리전스는 단순한 생성(generation) 능력을 넘어 이해(understanding)할 수 있기 때문에, 우리는 이와 같은 전 과정을 아우르는 시스템을 구축할 수 있었습니다"라고 설명했다.
예시로, 건축가가 건물을 설계하는 상황을 들었다. 건축가가 선을 그을 때, 실제 구조, 빛의 활용, 공간적 역동성, 그리고 거주 경험에 대한 내부적인 정신적 모델을 구축한다. 자인에 따르면, 이것이 바로 유니파이드 인텔리전스가 작동하는 원리와 동일하다.
자인은 이 시스템이 창작 워크플로우를 획기적으로 가속화할 수 있다고 말했다. 시연에서 그는 200단어 분량의 간략한 기획안(brief)과 제품 이미지(립스틱 튜브)를 입력하자, 시스템이 광고 캠페인을 위한 다양한 장소, 모델, 색상 조합 아이디어를 생성하는 과정을 보여주었다.
또 다른 사례로, 루마 에이전트는 한 브랜드의 1,500만 달러 규모의 1년 장기 캠페인을 단시간에 재구성하여, 여러 지역의 요구에 맞는 버전들을 만들어냈다.
결론적으로, 루마의 접근 방식은 단순한 도구 사용을 넘어, 창의적 문제 해결의 전체 사이클(end-to-end)을 지원하는 데 초점을 맞추고 있다는 것이다.