• OpenAI, ChatGPT 신규 '보이스 모드' 출시 연기

    article image

    OpenAI가 AI 기반 챗봇 플랫폼 ChatGPT에서 기이할 정도로 사실적이고 거의 실시간에 가까운 "고급 음성 모드(Advanced Voice Mode)"를 처음 시연했을 때, 당시 회사는 해당 기능이 몇 주 내로 유료 ChatGPT 사용자에게 순차적으로 제공될 것이라고 발표했습니다. 하지만 수개월이 지난 지금, OpenAI는 추가 시간이 필요하다고 밝혔습니다.

    OpenAI 공식 디스코드 서버에 게시된 글에 따르면, 회사는 애초 고급 음성 모드를 6월 말에 소규모 ChatGPT Plus 사용자 그룹을 대상으로 알파 테스트를 시작할 계획이었으나, 해결해야 할 여러 기술적 문제들로 인해 출시를 7월경으로 연기했다고 전했습니다.

    OpenAI는 "예를 들어, 모델이 특정 콘텐츠를 감지하고 거부하는 능력을 개선하고 있습니다"라며, "사용자 경험을 향상시키고 실시간 응답 속도를 유지하면서 수백만 명 규모로 확장할 수 있도록 인프라를 준비하는 작업도 진행 중입니다. 저희의 반복적인 배포 전략의 일환으로, 소수 사용자 그룹을 통해 알파 테스트를 시작하여 사용자 피드백을 수집하고 그에 따라 기능을 확장할 예정입니다"라고 설명했습니다.

    OpenAI는 고급 음성 모드가 특정 내부 안전 및 신뢰성 검증을 통과하는지 여부에 따라 모든 ChatGPT Plus 고객에게는 가을까지 출시될 수 있다고 밝혔습니다. 다만, 이러한 지연은 OpenAI가 봄 프레스 이벤트에서 별도로 시연했던 새로운 비디오 및 화면 공유 기능의 출시에는 영향을 미치지 않을 것이라고 덧붙였습니다.

    해당 신규 기능에는 사진을 기반으로 수학 문제를 해결하는 기능과 기기의 다양한 설정 메뉴를 설명하는 기능 등이 포함됩니다. 이 기능들은 스마트폰용 ChatGPT는 물론, macOS용 앱 같은 데스크톱 클라이언트에서도 작동하도록 설계되었습니다. (이 앱은 오늘 모든 ChatGPT 사용자에게 이용 가능하게 되었습니다.)

    OpenAI는 "ChatGPT의 고급 음성 모드는 감정과 비언어적 신호를 이해하고 응답하여, AI와의 실시간 자연스러운 대화에 한층 더 가까워지고 있습니다"라고 언급하며, "저희의 목표는 이러한 새로운 경험을 사용자분들께 신중하게 전달하는 것입니다"라고 밝혔습니다.

    실제 발표 행사 무대에서 OpenAI 직원들은 연구원의 스마트폰 카메라 앞에 놓인 종이의 수학 문제를 ChatGPT가 거의 즉각적으로 해결하는 시연을 선보이기도 했습니다.

    한편, OpenAI의 고급 음성 모드가 기본 'Sky' 목소리를 사용한 것이 여배우 스칼렛 요한나슨(Scarlett Johansson)의 목소리와 유사하여 상당한 논란을 일으켰습니다. 이후 요한나슨은 법률 대리인을 고용하여 해당 음성의 개발 과정과 정확한 세부 정보를 확인했다고 성명을 발표했으며, ChatGPT에 자신의 목소리를 라이선스하는 요청을 반복적으로 거절했다고 밝혔습니다.

    OpenAI는 해당 목소리를 허가 없이 사용했거나 유사한 목소리를 사용했다는 사실을 부인했음에도 불구하고, 나중에 해당 논란이 된 목소리를 제거했습니다.

    [출처:] https://techcrunch.com/2024/06/25/openai-delays-chatgpts-new-voice-mode