• 스피치파이, 크롬 확장 프로그램에 음성 받아쓰기 및 음성 비서 기능 추가

    article image

    (내용의 주어 생략 및 문맥상 연결)는 주로 기사, PDF, 문서를 듣는 데 도움을 주는 도구였습니다. 이제 이 회사는 자체 Chrome 확장 프로그램에 음성 타이핑 기능과 사용자의 질문에 답변하는 음성 비서 기능을 포함한 음성 감지 기능을 추가하고 있습니다.

    지난 12개월 동안 음성 인식 모델 전반의 품질 개선에 힘입어 음성 감지 도구가 폭발적으로 증가했습니다. Speechify 역시 이러한 흐름에 동참하여 영어 지원 기능을 갖춘 자체 받아쓰기 도구를 출시했습니다. 다른 받아쓰기 도구들과 마찬가지로 Speechify의 음성 타이핑 기능은 오류를 수정하고 불필요한 군더더기 말(filler words)을 제거해 줍니다.

    저의 짧은 테스트(하루가 조금 넘는 기간)를 거치며 Speechify의 도구에는 개선할 여지가 많다고 느꼈습니다. 예를 들어, Gmail이나 Google Docs에서는 도구가 원활하게 작동했지만, WordPress 같은 웹사이트에서는 음성 받아쓰기를 시작하고 안정적으로 작동시키는 데 어려움을 겪었습니다. 이에 대해 회사는 인기 웹사이트에 대한 최적화를 점진적으로 추가하고 있다고 밝혔습니다.

    정확도의 측면에서는, 단어 오류율(word error rate)이 [도구 A]나 [도구 B]와 같은 일부 다른 도구보다 높았습니다. Speechify는 모델을 많이 사용할수록 학습 속도가 빨라지며 오류율은 점차 감소할 것이라고 설명했습니다.

    또한 이 스타트업은 브라우저의 사이드바에 위치하는 대화형 음성 비서를 출시합니다. 사용자는 이 비서에게 "핵심 아이디어 세 가지는 무엇인가요?" 또는 "이 내용을 더 쉬운 말로 설명해주세요"와 같이 웹사이트에 관한 질문을 할 수 있습니다.

    article image

    ChatGPT와 Gemini 역시 대화 모드를 제공하지만, Speechify의 주장은 이 기능들이 각 앱 내에서 부가적인 요소(afterthought)로 취급된다는 것입니다. 반면, 이 스타트업의 자체 도구는 음성 기능을 전면에 내세우고 있습니다.

    회사의 최고 사업 책임자(CBO)인 Rohan Pavuluri는 TechCrunch에 이메일로 "ChatGPT와 Gemini를 앱을 열 때마다 채팅 기능이 기본 사용자 경험(default user experience)으로 자리 잡을 것이라고 믿습니다. 그것이 사용자들의 기대입니다. 음성은 항상 부차적이며—그리고 많은 경우 ChatGPT와 Gemini에게는 사후 고려 사항일 뿐입니다. 저희는 Speechify를 수년간 구축해 오면서, 우리 사용자들을 포함한 시장의 상당 부분이 앱을 열 때마다 음성을 주된 기본 설정으로, AI와 대화하는 방식으로 원한다는 것을 알고 있습니다"라고 말했습니다.

    여기서 주목할 만한 한계점은 Speechify의 비서가 OpenAI의 Atlas, Perplexity의 Comet, Dia처럼 자체 사이드바 비서 기능을 탑재한 브라우저와는 현재 작동하지 않는다는 점입니다. 하지만 이 스타트업은 이 점에 크게 우려하지 않습니다. 왜냐하면 확장 프로그램이 주로 Chrome의 방대한 사용자 기반을 염두에 두고 설계되었기 때문입니다.

    Speechify는 데스크톱과 모바일 전반의 모든 앱에 음성 타이핑과 음성 비서 기능을 점진적으로 통합할 계획이라고 밝혔습니다.

    이 스타트업은 또한 사용자를 대신하여 작업을 완료하는 에이전트(agent) 개발을 목표로 합니다. 구체적인 로드맵은 공개하지 않았지만, 예시로 약속 예약을 위해 전화를 걸거나 회사 고객 지원 대기 시간에 대기하는 등의 작업을 언급했습니다. [도구 C]나 [도구 D] 같은 다른 회사들도 유사한 목표를 추구해 왔습니다.

    [출처:] https://techcrunch.com/2025/11/25/speechify-adds-voice-typing-and-voice-assistant-to-its-chrome-extension