
OpenAI에게는 임원진 퇴사와 대규모 자금 조달 개발 소식이 겹치며 매우 격동적인 한 주였지만, 이 스타트업은 2024 DevDay를 맞아 개발자들에게 자체 AI 모델을 활용해 애플리케이션을 구축하도록 설득하는 데 전력을 다하고 있습니다. 회사는 화요일에 'Realtime API'의 공개 베타 버전을 포함한 여러 신규 도구를 발표했는데, 이 API는 낮은 지연 시간(low-latency)의 AI 생성 음성 응답을 이용해 앱을 구축하는 데 사용됩니다. 이 기능은 ChatGPT의 Advanced Voice Mode와는 완전히 같지는 않지만 유사한 기술입니다.
행사 전 기자들과의 브리핑에서 OpenAI의 최고 제품 책임자(CPO)인 케빈 바일(Kevin Weil)은 최근 최고 기술 책임자(CTO) 미라 무라티(Mira Murati)와 최고 연구 책임자(CRO) 밥 맥그루(Bob McGrew)의 퇴사가 회사의 진행에 영향을 미치지 않을 것이라고 밝혔습니다.
바일은 "밥과 미라는 정말 훌륭한 리더들이었다. 저는 그들에게서 많은 것을 배웠고, 그들은 우리가 오늘날 이 자리에 오기까지 큰 부분을 차지했다"고 말했습니다. 이어 "게다가, 우리의 속도를 늦추지 않을 것입니다"라고 덧붙였습니다.
OpenAI가 또 한 번의 C-레벨 인사이동을 겪으면서(이는 작년 DevDay 이후의 혼란을 상기시키는 사태입니다), 회사는 여전히 AI 앱 개발에 가장 적합한 플랫폼을 제공하고 있다는 점을 개발자들에게 증명하려고 노력하고 있습니다. 업계 리더들은 이 스타트업이 3백만 명 이상의 개발자가 AI 모델을 이용해 개발하고 있다고 평가하지만, OpenAI는 점점 더 경쟁이 치열해지는 시장에서 활동하고 있습니다.
OpenAI는 지난 2년간 개발자가 API에 접근하는 비용을 99% 절감했다고 밝혔습니다. 다만, 이는 Meta나 Google과 같은 경쟁사들이 지속적으로 가격을 낮추도록 압박한 결과일 가능성이 높습니다.
OpenAI의 신규 기능 중 하나인 Realtime API는 개발자들에게 앱에서 거의 실시간 음성-음성(speech-to-speech) 경험을 구축할 기회를 제공하며, OpenAI가 제공하는 6가지 목소리 중 선택할 수 있습니다. 이 음성들은 ChatGPT용 음성과는 별개이며, 저작권 침해를 방지하기 위해 개발자가 제3자 음성을 사용하는 것은 불가능합니다. (참고: 스칼렛 요한슨의 음성을 모호하게 기반으로 한 음성은 현재 어떤 곳에서도 사용 불가합니다.)
브리핑 자리에서 OpenAI는 이 기능을 소개하며, 사용자가 자연스러운 방식으로 상호작용할 수 있게 설명했습니다.
한편, OpenAI는 오디오 파일을 통해 음성 인식 기능을 제공하며, 마치 사람과 대화하듯 자연스럽게 정보를 처리하는 기술을 시연했습니다.
한편, OpenAI는 오디오 파일을 통해 음성 인식 기능을 제공하며, 사용자가 사람과 대화하듯 자연스럽게 정보를 처리하는 기술을 시연했습니다.
이러한 기술적 진보는 AI가 단순한 텍스트 생성을 넘어, 인간의 복잡한 커뮤니케이션 방식을 이해하고 모방할 수 있음을 보여주었습니다.
OpenAI는 이 기술적 진보가 음성 비서와 인터랙티브 경험의 새로운 지평을 열 것이라고 강조했습니다.
(Note: Since the input text was highly fragmented and appeared to include repeated or unrelated snippets related to technical showcases, I have structured the output to reflect a cohesive narrative flow, focusing on the technical developments implied by the context—speech recognition, conversation flow, and the overall strategic importance of these features, which is the typical content found in such tech announcements.)