ElevenLabs의 텍스트 음성 변환 앱 '리더(Reader)'가 글로벌 출시되었습니다

sw_reporter

AI 기반의 합성 음성 생성 및 편집 도구를 개발하는 스타트업 엘레븐랩스(ElevenLabs)가 32개 언어를 지원하는 앱을 전 세계적으로 출시하고 있습니다.

미국, 영국, 캐나다에서 지난 6월 처음 출시된 이 앱은 사용자가 기사, PDF 문서, 전자책 등 모든 텍스트 콘텐츠를 업로드하여 다양한 언어와 음성으로 들어볼 수 있게 합니다. '리더(Reader)' 앱은 현재 포르투갈어, 스페인어, 프랑스어, 힌디어, 독일어, 일본어, 아랍어, 한국어, 이탈리아어, 타밀어, 스웨덴어 등을 포함한 다국어 지원을 제공합니다.

올해 초 안드레센 호로위츠(Andreessen Horowitz)를 포함한 투자자들로부터 8,000만 달러를 유치하며 유니콘 기업이 된 엘레븐랩스는 더빙이나 텍스트-음성 변환(text-to-speech)과 같은 다양한 사용 사례를 위해 API를 제공합니다. 이 회사의 API는 라빗 r1(Rabbit r1)의 음성 상호작용은 물론, AI 기반 검색 엔진 퍼플렉시티(Perplexity) 및 오디오 플랫폼 포켓 FM(Pocket FM), 쿠쿠 FM(Kuku FM)의 텍스트-음성 기능 구동에도 활용됩니다. '리더' 앱은 엘레븐랩스의 첫 번째 소비자 대상(consumer-facing) 제품입니다.

이 스타트업은 다양한 언어에 적합한 수백 개의 새로운 음성 라이브러리를 추가했다고 밝혔습니다. 또한 지난달에는 주디 갈란드(Judy Garland), 제임스 딘(James Dean), 버트 레놀즈(Burt Reynolds), 로렌스 올리비에 경(Sir Laurence Olivier) 등 유명 배우들의 목소리를 앱에서 사용할 수 있도록 라이선스화했습니다.

엘레븐랩스는 언어 지원 확장이 지난달 출시된 자사의 터보 v2.5 모델(Turbo v2.5 model) 덕분이라고 언급했습니다. 이 모델은 텍스트-음성 변환 과정에서 지연 시간을 줄이고 품질을 향상시킨 것으로 알려졌습니다.

'리더' 앱의 가장 근접한 경쟁 제품으로는 문서 텍스트 스캔 기능, Gmail 및 Canvas와의 통합 기능을 제공하며 사용자가 자신의 목소리를 클론하여 텍스트를 읽게 하는 기능을 가진 [경쟁사 1]이 있습니다. 아울러 모질라 소유의 [경쟁사 2]와 뉴욕타임스(The New York Times)의 Audm 기반 오디오 앱 역시 콘텐츠 청취 서비스를 제공합니다.

엘레븐랩스는 이 앱에 오프라인 지원 및 오디오 클립 공유 기능 등 추가적인 기능을 탑재할 것이라고 밝혔습니다.

[출처:] https://techcrunch.com/2024/08/19/elevenlabs-reader-app-is-now-available-globally