• 크리스프, AI 활용해 인도인이 통화에서 미국인처럼 말하도록 돕는다

    article image

    오디오 스타트업 크리스프(Krisp)는 수요일, 인공지능(AI)을 활용해 통화 중 사용자의 억양을 변경하는 새로운 기능을 출시한다고 발표했다. 해당 회사는 초기에는 인도식 영어 억양을 미국식 영어로 변환하는 지원부터 제공한다.

    이 스타트업에 따르면, 억양 변환 과정은 화자 본연의 목소리는 유지하면서 발음 단위(phonemes)만 미국식 억양에 맞춰 전환하는 방식이다. 이 기능은 이미 기업 환경에서 테스트가 진행되었으며, 현재 베타 버전이 크리스프 데스크톱 앱으로 제공된다. 사용자는 통화 중 또는 통화 전에 언제든지 이 기능을 활성화하거나 비활성화할 수 있다.

    크리스프의 공동 창립자 아르토 미나시안(Arto Minasyan)은 이 기능 아이디어가 자신과의 대화에서 겪었던 문제에서 시작되었다고 설명했다. 그는 “많은 사람들이 제가 영어를 유창하게 구사하더라도 제 억양을 이해하지 못한다. 저희는 억양 변경이 서로가 대화하는 것을 훨씬 더 원활하게 할 수 있을 것이라 생각했습니다. 2년 전부터 이 문제에 대한 연구를 시작해왔으며, 이제 베타 버전으로 공개합니다”라고 말했다.

    다만, 보도통신원이 해당 기능을 테스트했을 때 처리된 음성이 자연스럽지 않거나 때때로 단어를 놓치는 현상이 발생했다. 크리스프는 이러한 결함은 베타 출시의 특성 때문이며, 시간이 지남에 따라 모델이 개선될 것이라고 해명했다.

    크리스프는 기업을 대상으로 이 기능을 테스트했을 때 판매 전환율(sales conversion rates)이 26.1% 상승했으며, 계약당 수익(revenue per book)이 14.8% 증가했다고 주장했다.

    크리스프.ai

    article image

    이 회사는 인도 출신 인력들이 STEM 분야 글로벌 노동력의 상당 부분을 차지하는 점을 고려해 인도 억양부터 먼저 다루기로 결정했다고 밝혔다. 나아가 필리핀 등 더 많은 억양에 대한 지원을 추가할 계획도 있다.

    한편, GV의 투자를 받은 사나스(Sanas)와 같은 경쟁 스타트업들은 이미 유사 기술을 콜센터에 대규모로 도입하여 활용하고 있다.

    크리스프는 다양한 억양과 방언을 포함하는 수천 개의 음성 샘플로 모델을 훈련시켰으며, 사용자 동의를 받은 미팅 비서 데이터를 활용했다고 밝혔다.

    미나시안은 이 기능의 또 다른 장점은 사용자 목소리에 대한 사전 훈련이 필요 없다는 점이라고 강조했다. 그 이유는 실시간으로 화자의 목소리 프로필을 생성하기 때문이다.

    2021년 자금을 조달한 크리스프는 올해 대면 회의(in-person meetings)를 지원하기 위해 iOS 및 Android 앱을 출시할 계획이며, Google Meet과의 원활한 통합을 위한 새로운 Chrome 확장 기능도 개발 진행 중이다.

    [출처:] https://techcrunch.com/2025/03/26/krisp-launches-a-dubbing-feature-to-change-accent-of-the-speaker-during-a-call