• 스테빌리티 AI의 새로운 AI 모델, 사진을 3D 장면으로 변환

    Stability AI가 신규 AI 모델인 Stable Virtual Camera를 출시하며, 이 모델로 2D 이미지를 현실적인 깊이와 원근감을 지닌 "몰입형(immersive)" 비디오로 변환할 수 있다고 회사 측은 주장했습니다.

    버추얼 카메라는 디지털 영화 제작이나 3D 애니메이션에서 장면을 실시간으로 포착하고 탐색하는 데 주로 사용되는 도구입니다. Stability는 이 모델을 통해 생성형 AI 기술을 접목함으로써 사용자에게 더욱 큰 제어력과 맞춤형 기능을 제공하고자 한다고 회사 블로그를 통해 밝혔습니다.

    Stable Virtual Camera는 하나 이상의 이미지(최대 32개)를 바탕으로, 사용자가 지정한 다양한 카메라 각도에서 장면의 "새로운 뷰(novel views)"를 생성합니다. 이 모델은 "나선형(Spiral)", "돌리 줌(Dolly Zoom)", "이동(Move)", "패닝(Pan)" 등을 포함한 "동적(dynamic)" 카메라 경로 또는 프리셋을 따라 이동하는 비디오를 제작할 수 있습니다.

    현재 연구 미리보기(research preview) 버전인 Stable Virtual Camera는 정사각형(1:1), 인물 사진(9:16), 가로(16:9) 비율로 최대 1,000프레임 길이의 비디오 생성이 가능합니다. 다만, Stability는 이 모델이 특정 시나리오, 특히 사람, 동물 또는 물과 같은 "동적 질감(dynamic textures)"이 포함된 이미지에서는 낮은 품질의 결과를 초래할 수 있다고 경고했습니다.

    Stability는 블로그 게시물에서 "매우 모호한 장면, 물체나 표면과 교차하는 복잡한 카메라 경로, 그리고 불규칙한 형태의 물체는 프레임 깜빡임 아티팩트(flickering artifacts)를 유발할 수 있으며, 특히 대상 시점이 입력 이미지와 크게 다를 경우 더욱 심각하다"고 언급했습니다.

    Stable Virtual Camera는 비상업적 라이선스(noncommercial license) 하에 연구 목적으로 이용 가능하며, AI 개발 플랫폼 Hugging Face에서 다운로드할 수 있습니다.

    Stable AI는 인기 이미지 생성 모델을 개발해 온 기업으로, 작년에는 에릭 슈미트(Eric Schmidt)와 냅스터(Napster) 창업자인 션 파커(Sean Parker)를 포함한 투자자들이 회사의 경영 정상화를 추진하며 새로운 자금을 유치한 바 있습니다. 다만, 회사의 공동 창립자이자 전 CEO인 에마드 모스탁(Emad Mostaque)이 회사를 재정적 난관에 빠뜨렸다는 지적이 나오면서, 직원들의 퇴사, Canva와의 파트너십 무산, 그리고 투자자들의 전망 우려가 고조되기도 했습니다.

    최근 몇 달 동안 Stability는 새로운 CEO를 영입하고, 영화 '타이타닉(Titanic)' 감독인 제임스 카메론(James Cameron)을 이사회에 초빙하는 등 조직 개편에 나섰으며, 여러 개의 신규 이미지 생성 모델을 출시했습니다. 앞서 지난 3월에는 칩 제조사 Arm과 협력하여, Arm 칩이 탑재된 모바일 기기용 사운드 효과를 포함한 오디오를 생성할 수 있는 AI 모델을 선보이기도 했습니다.

    [출처:] https://techcrunch.com/2025/03/18/stability-ais-new-ai-model-turns-photos-into-3d-scenes