엘레븐랩스(ElevenLabs) CEO, "AI 음성 모델은 시간이 지나면 '상품화'될 것"

sw_reporter

AI 오디오 회사

ElevenLabs

공동 창립자이자 최고 경영자인 마티 스타니스제프스키(Mati Staniszewski)는 AI 모델이 시간이 지남에 따라 범용화될 것이라 전망했다. 이는 현재 모델 구축에 주력하는 기업에게 매우 이례적인 발언으로 해석된다.

지난 화요일 컨퍼런스 무대에서 ElevenLabs의 창립자는 AI 오디오 분야에 대한 단기적 및 장기적 관점을 모두 제시했다.

스타니스제프스키는 자사 연구원들이 모델 아키텍처상의 난제를 해결하는 데 성공했으며, 이러한 기술 개발에 대한 집중은 앞으로 1~2년 동안 오디오 영역에서 계속될 것이라고 설명했다.

그는 “장기적으로는 범용화될 것입니다. 몇 년 안에 말이죠. 물론 일부 목소리나 언어에는 차이가 있을 수 있지만, 그 차이점 자체는 점차 작아질 것입니다”라고 말했다.

만약 모델이 시간이 지나 범용화될 것이라고 믿음에도 불구하고, ElevenLabs가 현재 모델 구축에 집중하는 이유에 대한 질문에 스타니스제프스키는 단기적으로 볼 때 모델 자체를 확보하는 것이 “현재 가질 수 있는 가장 큰 이점이자 가장 큰 변화”이기 때문이라고 설명했다.

그는 예를 들어, AI 음성이나 상호작용의 품질 문제가 해결되지 않았다면, 여전히 풀어나가야 할 숙제가 남아있다고 지적했다.

스타니스제프스키는 “이를 해결하는 유일한 방법은... 직접 모델을 구축하는 것이며, 장기적으로는 다른 경쟁사들 역시 이 문제를 해결할 것입니다”라고 강조했다.

나아가 그는 신뢰할 수 있고 확장 가능한 사용 사례를 찾는 기업들은 여전히 각기 다른 목적에 맞는 다양한 모델을 사용할 가능성이 높다고 언급했다.

다만, 향후 1~2년 동안에는 점차 더 많은 모델들이 멀티모달(multi-modal) 또는 융합적 접근 방식(fused approaches)으로 진화할 것이라고 예측했다.

그는 “즉, 오디오와 비디오를 동시에 만들거나, 대화 환경에서 오디오와 LLM을 동시에 구현하게 될 것입니다”라고 설명하며, 모델들을 결합하여 달성할 수 있는 사례로 구글의 Veo 3을 예시로 들었다.

이 창립자는 ElevenLabs가 다른 회사들과 파트너십을 맺고 오픈 소스 기술을 활용하여, 자체적인 오디오 전문성과 다른 모델들의 전문성을 결합할 수 있는지 연구할 계획이라고 덧붙였다.

그는 ElevenLabs의 목표는 모델 자체의 구축과 애플리케이션 개발 양쪽 모두에 집중하여 장기적인 가치를 창출하는 것이라고 역설했다.

마지막으로 그는 “애플에게 소프트웨어와 하드웨어의 결합이 마법이었던 것처럼, 우리는 제품과 AI의 결합이 최고의 사용 사례를 창출하는 마법이 될 것이라 생각합니다”라고 입을 다물었다.

[출처:] https://techcrunch.com/2025/10/29/elevenlabs-ceo-says-ai-audio-models-will-be-commoditized-over-time