
니콜라스 레너드(Nicholas Leonard)와 데릭 카네하(Derek Caneja)는 AI 음성 에이전트 구축을 목표로 했으나, 실제 제품을 개발하며 많은 음성 에이전트들이 설계상의 결함을 안고 있음을 체감했습니다.
이러한 에이전트들 중 일부는 노코드(no-code) 툴을 사용해 운영 환경 배포(shipping to production)가 빠르다는 장점이 있지만, 제품의 품질은 낮은 경우가 많았습니다. 반면, 다른 에이전트들은 전문 툴을 구축할 시간과 자원을 가진 기업들에서 제작되었습니다. 레너드는 TechCrunch과의 인터뷰에서 "개발자와 기업 모두에게는 대안이 필요했다"고 말하며, 자신과 카네하 역시 소프트웨어의 미래가 궁극적으로 "코딩 에이전트에 의해 코딩되고, 검증되며, 최적화될 것"이라는 점을 깨달았다고 덧붙였습니다.
회사의 CEO인 레너드는 "이러한 두 가지 통찰과 역사적인 깨달음이 저희에게 VoiceRun의 영감을 주었습니다"라고 전했습니다. 카네하는 회사의 CTO를 맡고 있습니다.
지난해 그들은 개발자 및 코딩 어시스턴트가 음성 에이전트를 개발하고 확장할 수 있는 플랫폼, VoiceRun을 출시하기로 결정했습니다. 현재 많은 로우코드(low-code) 플랫폼들은 사용자가 시각적 다이어그램을 통해 음성 에이전트를 만들도록 합니다. 사용자는 대화 흐름(conversation flows)을 따라 클릭하고 박스에 프롬프트를 작성하여 에이전트의 행동 방식을 지정합니다. 하지만 레너드에 따르면, 이 과정 전체를 관리하는 것은 어려울 수 있습니다.
반면 VoiceRun은 사용자가 원하는 방식대로 음성 에이전트의 동작을 코드로 직접 작성할 수 있게 함으로써, 제품 생성에 훨씬 더 큰 유연성을 제공합니다. 레너드는 코드가 코딩 에이전트의 네이티브 언어라고 설명했습니다. 그는 "에이전트들이 시각적 인터페이스보다 코드를 통해 작동할 때 훨씬 더 뛰어난 성능을 보일 것"이라고 강조했습니다.
또한, 시각적 인터페이스는 구성 옵션에 한계가 따릅니다. 예를 들어, 특정 방언으로 말하는 음성 에이전트를 만들고자 할 때, 시각적 인터페이스를 만든 쪽에서 해당 기능을 제공하지 않으면 개발 난이도가 높아집니다.
하지만 레너드는 "코드에서는 그 과정이 믿을 수 없을 만큼 간단하다"며, "시각적 인터페이스가 지원하지 않는 수백만 가지에 달하는 미세한 시나리오들, 즉 방대한 롱테일(long tail)의 영역이 존재합니다"라고 말했습니다.
코딩 에이전트 개발 외에도 VoiceRun은 사용자들이 A/B 테스트를 수행하고 클릭 한 번으로 즉시 배포할 수 있도록 지원합니다.
이 회사는 기업 개발자를 주 타겟으로 하며, 기업이 자사 고객 서비스에 AI를 통합하거나 기술 기업이 음성 기반 제품을 출시하는 것을 돕고 있습니다. 레너드는 식당 기술 회사와 함께 음식 예약용 AI 전화 컨시어지를 출시하는 프로젝트 참여 경험을 예시로 들었습니다.
이 회사는 수요일, Flybridge Capital이 주도한 550만 달러 규모의 시드 라운드(seed round)를 마감했다고 발표했습니다.
AI 에이전트 시장에는 경쟁이 매우 치열합니다. 이 분야의 스타트업들은 작년에 수십억 달러를 확보했습니다(이는 일반적으로 AI 회사 전체에 유입되는 수많은 수십억 달러 중 일부입니다). 레너드는 자사 회사가 시장의 양극단에 대응한다고 설명합니다. 한쪽은 Bland나 Retell AI처럼 사용자들에게 빠른 데모 제작을 가능하게 하는 노코드 음성 빌더들이고, 다른 한쪽은 개발자에게 "최대 제어(maximum control)"를 부여하는 LiveKit이나 Pipecat 같은 고도화된 툴들입니다. 그는 VoiceRun이 이 두 극점 사이의 중간 지점에 위치한다고 느낍니다.
그는 "저희는 글로벌 음성 인프라와 평가 기반의 라이프사이클을 제공하면서도, 비즈니스 로직 코드와 데이터의 소유권을 고객 측에 온전히 맡깁니다. 핵심 차별점은 저희가 엔드투엔드(end-to-end) 프로세스를 완성한다는 점입니다."
나아가, 레너드는 "음성 인터페이스는 이미 우리 생활의 일부입니다."
한편, 그는 "모델 T 이전의 자동차 기술이나, 1900년대 초의 전화 통신이 그랬듯, 음성 인터페이스 역시 우리가 기대했던 것보다 훨씬 더 빠르게 표준화되고 대중화될 것입니다."
그는 마지막으로 "오래된 전화 기술이 사라지듯, 저희 제품도 곧 우리 삶의 자연스러운 부분이 될 것입니다."
[출처:] https://techcrunch.com/2026/01/14/voicerun-nabs-5-5m-to-build-voice-agent-factory