• ChatGPT, OpenAI가 최초 시연한 지 7개월 만에 실시간 비디오 이해 기능 구현

    article image

    OpenAI가 약 7개월 전 시연했던 ChatGPT의 실시간 비디오 기능을 마침내 출시했습니다.

    목요일 라이브 스트리밍에서 OpenAI는 ChatGPT의 인간과 유사한 대화 기능에 시각(vision) 능력을 통합했다고 밝혔습니다. 이제 ChatGPT 앱을 사용하는 사용자들은 ChatGPT Plus, Team 구독에 가입하거나, 휴대폰 카메라를 물체에 비추어 ChatGPT가 거의 실시간으로 응답하도록 할 수 있습니다.

    비전 기능이 적용된 '고급 음성 모드(Advanced Voice Mode with vision)'는 화면 공유를 통해 기기 화면에 표시된 내용까지 이해할 수 있습니다. 예를 들어 다양한 설정 메뉴를 설명하거나 수학 문제에 대한 제안을 할 수 있습니다.

    이 기능에 접속하려면, ChatGPT 채팅 바 옆의 음성 아이콘을 탭한 후, 왼쪽 하단의 비디오 아이콘을 탭하여 비디오 기능을 활성화합니다. 화면을 공유하려면, 세 점 메뉴를 탭하고 "화면 공유(Share Screen)"를 선택하면 됩니다.

    OpenAI에 따르면, 고급 음성 모드와 비전 기능의 배포는 목요일에 시작하여 다음 주에 마무리될 예정입니다. 하지만 모든 사용자에게 순차적으로 제공되는 것은 아닙니다. OpenAI는 ChatGPT Enterprise와 Edu 구독자는 1월 이후에야 이 기능을 이용할 수 있으며, EU, 스위스, 아이슬란드, 노르웨이 또는 리히텐슈타인에 거주하는 ChatGPT 사용자들에게는 아직 구체적인 시간표가 없다고 전했습니다.

    최근 CBS News의 "60 Minutes"에서 열린 시연에서, OpenAI 사장인 그렉 브록먼(Greg Brockman)은 고급 음성 모드와 비전 기능을 활용해 앤더슨 쿠퍼(Anderson Cooper)의 해부학 지식을 테스트했습니다. 쿠퍼가 칠판에 신체 부위를 그릴 때, ChatGPT는 그가 무엇을 그리고 있는지 "이해"하는 모습을 보여주었습니다.

    OpenAI 직원들이 라이브 스트리밍 동안 ChatGPT의 고급 음성 모드와 비전을 시연하고 있다.

    article image

    OpenAI: "위치가 정확하네요." ChatGPT가 답했습니다. "뇌는 머릿속에 바로 있습니다. 모양에 관해서는 좋은 시작이지만, 뇌는 좀 더 타원형에 가깝습니다."

    한편, 동일한 시연에서 고급 음성 모드는 기하학 문제에서 오류를 보이기도 했는데, 이는 해당 기능이 환각(hallucinating)을 일으키기 쉬울 수 있음을 시사합니다.

    고급 음성 모드와 비전 기능은 여러 차례 출시가 지연되었습니다. 이는 OpenAI가 해당 기능을 실제 제품 출시에 적합하기 훨씬 전에 예고했기 때문이라는 보도가 있습니다. 실제로 OpenAI는 지난 4월, 고급 음성 모드가 사용자들에게 "몇 주 내로" 배포될 것이라고 약속했었습니다. 몇 달 뒤에는 시간이 더 필요하다고 수정 발표한 바 있습니다.

    고급 음성 모드가 일부 ChatGPT 사용자에게 가을 초입에 처음 공개되었을 당시, 이 기능은 시각 분석 구성 요소가 부족하다는 한계를 가졌었습니다. 목요일 출시를 앞두고, OpenAI는 음성 전용 고급 음성 모드 경험을 추가 플랫폼과 EU 사용자들에게 확산하는 데 초점을 맞추어 왔습니다.

    구글(Google)이나 메타(Meta) 같은 경쟁사들 역시 각자의 챗봇 제품에 유사한 기능을 개발하고 있습니다. 이번 주에는 구글이 실시간 비디오 분석 대화형 AI 기능인 Project Astra를 안드로이드 기반의 "신뢰할 수 있는 테스터(trusted testers)" 그룹에게 공개했습니다.

    고급 음성 모드와 비전 기능 외에도, OpenAI는 목요일에 연말 분위기의 '산타 모드(Santa Mode)'를 추가했는데, 이는 ChatGPT에 산타의 음성을 기본 음성 옵션으로 제공합니다. 사용자는 ChatGPT 앱의 프롬프트 바 옆 눈송이 아이콘을 탭하거나 클릭하여 이 모드를 찾을 수 있습니다.

    2024년 12월 5일 – 2024년 12월 18일
    스토리라인에서 발췌: 실시간 업데이트: 12일간의 OpenAI ChatGPT 발표 및 공개
    OpenAI의 연말 행사가 시작됩니다.

    [출처:] https://techcrunch.com/2024/12/12/chatgpt-now-understands-real-time-video-seven-months-after-openai-first-demoed-it