
최근 몇 년 사이 음성 AI의 활용 분야가 판매, 마케팅, 고객 지원, 일반 소비자 애플리케이션 등 전방위적으로 급증했습니다. 이에 따라 모델 제공 업체들은 투자자들의 관심과 함께 사업 규모가 커지는 추세를 보였습니다. 이러한 수요를 바탕으로, [회사명]은 AVP가 주도한 시리즈 C 라운드에서 1억 3,000만 달러를 유치하며 기업가치를 13억 달러로 평가받았다고 밝혔습니다.
이번 라운드에는 알키온(Alkeon), 인-큐-텔(In-Q-Tel), 마드로나(Madrona), 타이거(Tiger), 윙(Wing), Y Combinator와 같은 기존 투자자들이 추가 출자했으며, 알럼나이 벤처스(Alumni Ventures), 컬럼비아 대학교(Columbia University), 프린스빌 캐피털(Princeville Capital), 트윌리오(Twilio), SAP 등 신규 투자자들이 참여했습니다. 해당 회사는 현재까지 누적 2억 1,500만 달러 이상의 자금을 유치했습니다.
이번 투자 유치 규모는 지난해 음성 AI 분야에서 기록된 대규모 투자 유치 트렌드를 이어가는 것입니다. 작년에는 세사미(Sesame)가 2억 5,000만 달러 규모의 시리즈 B를, 엘레븐랩(ElevenLab)이 1억 8,000만 달러 규모의 시리즈 C를, 그라디움(Gradium)이 7,000만 달러 규모의 시드 라운드를 유치하며 시장을 주도했습니다.
AVP의 파트너인 엘리자베스 드 생티냥(Elizabeth de Saint-Aignan)은 TechCrunch와의 인터뷰에서, 투자 펀드가 기업들에게 AI 활용 방안에 대해 논의하는 과정에서 음성(voice) 관련 주제가 자주 언급되자 이 분야의 기업들을 조사하기 시작했다고 전했습니다.
그녀는 "2024년 기업들과의 만남에서 업무 내 AI 활용에 대한 논의가 오갔을 때, 콜센터나 영업 개발 같은 프로세스에서 음성 AI 사용 사례가 빈번하게 들렸습니다. 더 깊이 대화해 보니, 많은 음성 AI 기술이 Deepgram의 기반 기술로 구동되고 있다는 사실을 깨달았고, 이것이 우리가 Deepgram에 관심을 갖게 된 계기였습니다"라고 설명했습니다.
또한 그녀는 음성 AI가 기업과 고객 간의 상호작용을 더욱 쾌적하게 만들면서도 기업의 비용 절감에 기여할 수 있으며, Deepgram이 이 과정에서 핵심적인 역할을 수행할 수 있다고 강조했습니다.
Deepgram은 텍스트 음성 변환(text-to-speech) 및 음성 텍스트 변환(speech-to-text) 관련 광범위한 모델을 갖추고 있을 뿐만 아니라, 낮은 지연 시간(low latency)을 자랑하는 대화형 음성 인식 및 중단 처리(interruption handling)용 플랫폼과 API도 제공합니다. 현재 이 회사의 제품과 모델은 미팅 메모 작성기 그라놀라(Granola), 음성 에이전트 스타트업 바피(Vapi), 트윌리오(Twilio)를 포함하여 1,300개 이상의 기관에서 활용되고 있는 것으로 알려졌습니다.
이 회사의 CEO인 스콧 스티븐슨(Scott Stephenson)은 자금 조달이 필수적이지 않았으며 작년에도 현금 흐름이 흑자였기 때문이라고 설명했습니다.
그는 "지난해 음성 AI는 이미 주류 시장이 되었고, 잠재적인 동력이 크게 증가했습니다. 저희는 성장을 가속화하기 위해 더 큰 투자를 조기에 할 수 있는 기회를 보고 있습니다. 이것이 지금 투자 유치를 하기에 적절한 시기라고 판단한 이유입니다"라고 밝혔습니다.
이어 "하지만 저희가 자금을 찾아다닌 것은 아닙니다. 여러 관계자들로부터 접근이 있었습니다. 저희는 음성 AI와 그 기술적 복잡성을 깊이 이해하고, 해당 기술을 기반으로 솔루션을 구축하는 회사들과의 연결고리를 가진 전략적 투자자들을 원했습니다"라고 덧붙였습니다.
회사는 이번 자금 조달 자금을 통해 글로벌 시장 진출을 확대하고 다국어 지원을 개선하는 데 사용할 계획입니다. 또한, 음성 AI를 활용한 레스토랑 부문 공략에도 주력하고 있습니다. 이를 위해, 빠른 서비스 레스토랑을 위한 음성 AI 기반 솔루션을 개발한 Y Combinator 지원 스타트업 OfOne을 인수했습니다. 이 스타트업은 주문 인식 정확도가 93%가 넘는다고 주장합니다. 한편, 음성 AI는 레스토랑 환경에서 어려움을 겪기도 했습니다. 작년 타코벨(Taco Bell)은 한 고객이 물컵을 18,000개 주문한 사건을 계기로 음성 AI 실험을 철회한 바 있습니다.
스티븐슨은 "'음성 AI 기반 음식 주문' 기능에 대해 기대가 큽니다. 음식 주문은 3억 명 이상의 미국인이 음성 AI를 경험하는 첫 번째 긍정적인 상호작용이 될 수 있기 때문입니다. 지난 20년간 음성 AI를 사용하며 많은 실망스러운 경험을 했습니다. 여러 비서(assistant)들이 출시되었지만, 사람들은 그것들이 마법과 같은 경험을 제공하지 못한다고 느꼈습니다. 하지만 자연스러운 대화로 음식을 주문할 수 있게 된다면, 사람들은 이 기술이 완전히 준비되었다고 인식할 것이라고 생각합니다"라고 말했습니다.
OfOne의 인수 소식이 Carl’s Jr.와 같은 브랜드를 서비스하는 Presto가 1,000만 달러의 신규 자금을 확보한 이후에 나온 점을 감안할 때, 이 분야 전반에 투자자들의 높은 관심이 쏠리고 있음을 알 수 있습니다. 애널리스트 보고서에 따르면 음성 시장은 연평균 30% 이상 성장하여 2030년까지 140억~200억 달러 규모의 거대 시장을 형성할 것으로 예상됩니다. 이러한 성장세를 바탕으로, 모델 및 API 제공업체들은 음성 솔루션을 개발하는 기업 및 스타트업들에게 핵심 인프라 역할을 수행하며 수십억 달러 규모의 기업으로 자리매김할 것으로 전망됩니다.
[출처:] https://techcrunch.com/2026/01/13/deepgram-raises-130m-at-1-3b-valuation-and-buys-a-yc-ai-startup