
레딧 AMA(Ask Me Anything)에서 OpenAI의 샘 알트만 CEO는 컴퓨팅 용량 부족이 회사가 원하는 만큼 제품을 출시하지 못하는 주요 원인 중 하나임을 인정했습니다.
그는 OpenAI의 차기 AI 모델 출시가 지연되는 이유에 대한 질문에 답하며 "모든 모델들이 매우 복잡해졌습니다. 또한, 저희가 수많은 훌륭한 아이디어에 컴퓨팅 자원을 어떻게 할당할지 결정하면서 많은 제약과 어려운 선택에 직면하고 있습니다"라고 밝혔습니다.
보도에 따르면, OpenAI는 생성형 모델을 훈련하고 구동하는 데 충분한 컴퓨팅 인프라를 확보하는 데 어려움을 겪어왔습니다. 이번 주 로이터 통신은 출처를 인용해 OpenAI가 모델 구동용 AI 칩을 개발하기 위해 브로드컴(Broadcom)과 수개월째 협력 중이며, 이 칩은 2026년 경에나 도착할 수 있다고 전했습니다.
알트만은 자원 부족의 영향으로, ChatGPT에 구현될 예정이던 현실적인 대화 기능이 지난 4월에 공개되었던 비전 기능들을 당장 활용할 수는 없을 것이라고 설명했습니다. OpenAI는 4월 기자 간담회에서 스마트폰으로 구동되는 ChatGPT 앱이 카메라 시야 내의 대상(예: 옷) 같은 시각적 단서에 반응하는 모습을 시연한 바 있습니다.
한편, 포춘(Fortune)지는 이 시연이 같은 주에 열린 구글 I/O 개발자 콘퍼런스에서 관심을 끌기 위해 서둘러 진행된 것이라고 추후 보도했습니다. OpenAI 내부 관계자들 사이에서는 GPT-4o가 공개 준비가 완료되지 않았다는 의견이 지배적이었습니다. 실제로 음성 전용 Advanced Voice Mode의 출시마저 몇 달간 연기되었습니다.
알트만은 AMA에서 OpenAI의 이미지 생성기 DALL-E의 다음 주요 버전은 아직 출시 일정이 확정되지 않았다고 말했습니다. ("아직 출시 계획이 없습니다"라고 덧붙였습니다.) 그와 동시에, OpenAI의 비디오 생성 도구는 "모델을 완성하고, 안전성, 사칭 방지 및 기타 요소를 갖추며, 컴퓨팅 자원을 확장할 필요성" 때문에 지연되고 있다고 OpenAI의 최고 제품 책임자(CPO) 케빈 바일(Kevin Weil)이 AMA에 참여해 언급했습니다.
한편, 소라(Sora)는 루마(Luma), 런웨이(Runway) 등 경쟁 시스템에 비해 기술적 난관에 봉착하며 입지가 불안정한 것으로 알려졌습니다.
더 인포메이션(The Information)에 따르면, 2월에 공개된 초기 버전 시스템은 1분짜리 비디오 클립 하나를 만드는 데 10분 이상의 처리 시간을 요구했습니다.
또한, 10월에는 소라의 공동 개발자 중 한 명인 팀 브룩스(Tim Brooks)가 구글(Google)로 이직했습니다.
AMA 후반부에서 알트만은 OpenAI가 ChatGPT에 "언젠가" 'NSFW' 콘텐츠를 허용하는 방안도 고려하고 있다고 밝히며 ("성인 사용자를 성인 대접할 것이라고 전적으로 믿습니다"라고 적었습니다), 회사의 최우선 목표는 일련의 '추론(reasoning)' 모델과 그 후속 모델들을 개선하는 것이라고 강조했습니다. OpenAI는 이번 주 런던 DevDay 콘퍼런스에서 이미지 이해 기능을 포함하여 o1에 적용될 다양한 기능을 미리 선보였습니다.
알트만은 "올해 후반에 매우 훌륭한 제품들이 나올 것입니다. 다만, 저희가 GPT-5라고 부를 것은 아닙니다"라고 덧붙였습니다.