• OpenAI, 더 많은 음성 및 새 디자인으로 'Advanced Voice Mode' 출시

    article image

    OpenAI는 화요일에 Advanced Voice Mode (AVM)를 ChatGPT의 더 폭넓은 유료 고객들에게 순차적으로 출시한다고 발표했습니다. ChatGPT와의 대화 경험을 더욱 자연스럽게 만들어주는 이 오디오 기능은 초기에는 ChatGPT의 Plus 및 Teams 등급 고객부터 이용 가능하며, Enterprise 및 Edu 고객들은 다음 주부터 접근 권한을 받게 됩니다.

    AVM 출시와 함께 디자인도 개편되었습니다. 이 기능은 이전 OpenAI가 지난 5월 기술 쇼케이스에서 선보였던 애니메이션 검은 점 대신 파란색 애니메이션 구체로 표현됩니다.

    사용자가 AVM 이용이 가능해지면, ChatGPT 앱에서 음성 아이콘 옆에 팝업 알림을 받게 됩니다.

    Advanced Voice는 이번 주 동안 ChatGPT 앱의 모든 Plus 및 Team 사용자에게 단계적으로 제공될 예정입니다.

    오랫동안 기다려주신 사용자들을 위해, 사용자 지정 지침(Custom Instructions), 메모리(Memory), 다섯 가지 신규 음성, 그리고 개선된 억양 기능이 추가되었습니다. 또한 50개 이상의 언어로 "늦어서 죄송합니다(Sorry I’m late)"라는 표현도 가능해졌습니다.

    pic.twitter.com/APOqqhXtDg

    — OpenAI (@OpenAI)

    2024년 9월 24일

    ChatGPT에는 사용자가 체험할 수 있는 다섯 가지 새로운 음성(Arbor, Maple, Sol, Spruce, Vale)이 추가되었습니다. 이로써 ChatGPT의 총 음성 개수는 Breeze, Juniper, Cove, Ember와 더불어 9개가 되었으며, 이는 Google의 Gemini Live에 버금가는 수치입니다. 이 이름들이 모두 자연에서 영감을 받았다는 점을 흥미롭게 느낄 수 있는데, 이는 AVM의 궁극적인 목표가 ChatGPT 사용 경험을 더욱 자연스럽게 만드는 것과 일맥상통합니다.

    이 음성 라인업에서 빠진 것은 Sky입니다. Sky는 OpenAI가 봄 업데이트 기간에 공개했던 음성으로, 이로 인해 스칼렛 요한슨으로부터 법적 위협이 제기되었습니다. 단편 영화 "Her"에서 AI 시스템을 연기한 해당 여배우는 Sky의 음성이 자신의 목소리와 지나치게 유사하다고 주장했습니다. 이에 OpenAI는 당시 내부 직원들이 트위터에 영화를 언급하는 글을 남겼음에도 불구하고, Sky의 음성은 요한슨의 목소리를 의도적으로 모방한 것이 아니라고 밝히며 신속하게 해당 음성을 내렸습니다.

    이번 출시에서 제외된 또 다른 기능은 ChatGPT의 비디오 및 화면 공유 기능입니다. 이 기능은 OpenAI가 4개월 전 봄 업데이트 때 선보인 것이며, GPT-4o가 시각 및 청각 정보를 동시에 처리하는 것을 목표로 합니다. 데모에서 OpenAI 직원은 사용자가 눈앞에 놓인 종이의 수학 문제에 대해 실시간 질문을 하거나 컴퓨터 화면의 코드를 ChatGPT에 물어보는 방법을 시연했습니다. 현재 OpenAI는 이러한 다중 모드(multimodal) 기능의 출시 시점에 대한 계획을 밝히지 않았습니다.

    그럼에도 불구하고 OpenAI는 AVM의 제한적 알파 테스트 이후 여러 개선 작업이 이루어졌다고 밝혔습니다. ChatGPT의 음성 기능이 현재는 억양 이해도가 향상되었으며, 회사 측은 대화가 더욱 부드럽고 빨라졌다고 언급했습니다. AVM으로 테스트를 진행했을 때 오류(glitches)가 종종 발견되기도 했으나, 회사는 이 부분이 개선되었다고 주장합니다.

    또한, OpenAI는 ChatGPT의 일부 사용자 정의 기능(Custom Instructions, 사용자가 ChatGPT의 응답 방식을 개인화할 수 있도록 돕는 기능)과 메모리(Memory, ChatGPT가 대화 내용을 기억했다가 나중에 참조할 수 있게 하는 기능)를 AVM에도 확장 적용하고 있습니다.

    한 OpenAI 대변인에 따르면, AVM은 EU, 영국, 스위스, 아이슬란드, 노르웨이, 리히텐슈타인을 포함한 일부 지역에서는 아직 이용할 수 없습니다.

    [출처:] https://techcrunch.com/2024/09/24/openai-rolls-out-advanced-voice-mode-with-more-voices-and-a-new-look