미드저니, 최초의 AI 비디오 생성 모델 V1 출시

sw_reporter

가장 인기 있는 AI 이미지 생성 스타트업 중 하나인 Midjourney가 수많은 기대를 모았던 AI 비디오 생성 모델 V1 출시를 수요일에 발표했다.

V1은 이미지-비디오 모델(image-to-video model)로, 사용자가 이미지를 업로드하거나 Midjourney의 다른 모델로 생성한 이미지를 활용하면, 이를 기반으로 총 네 개의 5초 분량 비디오 세트를 제작할 수 있다. Midjourney의 다른 이미지 모델들과 마찬가지로 V1은 현재 Discord를 통해서만 접근 가능하며, 출시 초기에는 웹에서만 이용 가능하다.

[트위터 인용문]
— Midjourney (@midjourney)
2025년 6월 18일
"V1 비디오 모델을 소개합니다. 재미있고, 쉽고, 아름답습니다. 월 10달러에 이용 가능하며, 모두를 위한 최초의 비디오 모델로서 현재 즉시 이용할 수 있습니다."

V1의 출시는 Midjourney를 OpenAI의 Sora, Runway의 Gen 4, Adobe의 Firefly, Google의 Veo 3 등 다른 기업들의 AI 비디오 생성 모델과 직접적인 경쟁 구도에 놓이게 했다. 다수의 기업들이 상업적 환경에서 사용 가능한 ‘제어 가능한(controllable)’ AI 비디오 모델 개발에 초점을 맞추는 반면, Midjourney는 항상 창의적인 사용자를 겨냥한 독특한 AI 이미지 모델로 두각을 나타내 왔다.

회사는 자사 AI 비디오 모델의 목표가 할리우드 영화를 위한 B-roll(보조 영상) 제작이나 광고 업계의 상업 광고 제작을 넘어설 것이라고 강조했다. Midjourney CEO인 David Holz는 블로그 게시물에서 자사의 AI 비디오 모델이 최종 목표인 "실시간 오픈 월드 시뮬레이션이 가능한" AI 모델을 구현하는 과정에서 회사의 다음 단계라고 언급했다.

나아가 Midjourney는 AI 비디오 모델 외에도 3D 렌더링을 위한 AI 모델과 실시간 AI 모델 개발을 계획하고 있다고 밝혔다.

한편, Midjourney의 V1 모델 출시는 해당 스타트업이 할리우드에서 가장 악명 높은 영화 스튜디오 두 곳인 디즈니(Disney)와 유니버설(Universal)로부터 소송을 당한 지 불과 일주일 만이다. 이 소송은 Midjourney의 AI 이미지 모델이 생성한 이미지가 호머 심슨(Homer Simpson)이나 다스 베이더(Darth Vader) 등 해당 스튜디오의 저작권 캐릭터를 묘사했다고 주장하고 있다.

할리우드 스튜디오들은 Midjourney가 개발하는 모델과 같은 AI 이미지 및 비디오 생성 모델의 급증하는 인기를 두고 어려움을 겪고 있다. 이러한 AI 도구들이 해당 분야 크리에이터들의 직업을 대체하거나 가치를 떨어뜨릴 수 있다는 우려가 커지고 있으며, 여러 미디어 회사들은 이 제품들이 자신들의 저작권으로 학습되었을 가능성을 제기하고 있다.

Midjourney는 스스로를 즉각적인 상업적 활용보다는 창의성에 더 초점을 맞춘 다른 AI 스타트업들과는 다르다고 포지셔닝하려 하지만, 이러한 비난의 흐름을 완전히 피하기는 어려워 보인다.

한편, Midjourney는 비디오 생성 비용이 일반 이미지 생성 비용보다 8배 비쌀 것이라 밝히면서, 사용자가 비디오를 생성할 때 월별 할당 생성량을 이미지보다 훨씬 빠르게 소진하게 될 것이라고 경고했다.

V1을 체험할 수 있는 가장 저렴한 방법은 Midjourney의 월 10달러 Basic 플랜에 구독하는 것이다. Midjourney의 월 60달러 Pro 플랜과 월 120달러 Mega 플랜 구독자는 회사가 제공하는 느린 속도의 "Relax" 모드에서 비디오를 무제한으로 생성할 수 있다. Midjourney는 다음 한 달 동안 비디오 모델의 가격 책정을 재평가할 것이라고 밝혔다.

[트위터 인용문]
— Phi Hoang (@apostraphi)
2025년 6월 18일
"midjourney가 비디오 생성을 도입했는데, 제 예상을 뛰어넘습니다."

V1은 사용자가 모델의 결과물을 세밀하게 제어할 수 있는 여러 사용자 정의 설정을 제공한다.

사용자는 이미지를 무작위로 움직이게 하는 '자동 애니메이션 설정'을 선택하거나, 원하는 특정 애니메이션을 텍스트로 묘사하여 추가할 수 있는 '수동 설정'을 선택할 수 있다. 또한 설정에서 "낮은 움직임(low motion)" 또는 "높은 움직임(high motion)"을 토글하여 카메라 및 피사체의 움직임 정도를 조절할 수 있다.

V1으로 생성된 비디오의 기본 길이는 5초에 불과하지만, 사용자는 이를 최대 4초씩 네 번까지 연장할 수 있어, 최대 21초 길이까지 확장 가능하다.

Midjourney의 AI 이미지 모델과 마찬가지로, V1 비디오의 초기 데모는 극사실적이라기보다는 다소 초현실적인(otherworldly) 분위기를 풍긴다. V1에 대한 초기 반응은 대체로 긍정적이었지만, 시장에 수개월 혹은 수년 동안 출시된 다른 주요 AI 비디오 모델들과 비교했을 때 어느 수준에 도달했는지는 아직 불분명한 상황이다.

[출처:] https://techcrunch.com/2025/06/18/midjourney-launches-its-first-ai-video-generation-model-v1