OpenAI, GPT-5 신버전으로 코덱스(Codex) 업그레이드

sw_reporter

OpenAI는 월요일에 AI 코딩 에이전트를 위한 GPT-5의 새 버전을 출시한다고 발표했습니다. 회사는 GPT-5-Codex라는 새로운 모델이 기존 모델보다 '사고(thinking)' 시간을 훨씬 역동적으로 사용하며, 하나의 코딩 작업에 몇 초에서 최대 7시간까지 시간을 할애할 수 있다고 밝혔습니다. 그 결과, 이 모델은 에이전트 코딩 벤치마크에서 이전보다 뛰어난 성능을 보여줍니다.

이 새로운 모델은 현재 Codex 제품군에 순차적으로 배포되고 있으며, 터미널, IDE, GitHub, 또는 ChatGPT를 통해 접근 가능한 모든 ChatGPT Plus, Pro, Business, Edu, Enterprise 사용자에게 제공됩니다. OpenAI에 따르면, 이 모델은 향후 API 고객들에게도 제공될 계획입니다.

이번 업데이트는 OpenAI가 Codex의 경쟁력을 강화하여 Claude Code, Anysphere의 Cursor, Microsoft의 GitHub Copilot과 같은 다른 AI 코딩 제품들과 대등하게 맞서기 위한 노력의 일환입니다. 최근 강력한 사용자 수요에 힘입어 AI 코딩 도구 시장은 매우 혼잡해졌습니다. 실제로 Cursor는 2025년 초에 ARR(연간 반복 매출) 5억 달러를 돌파했으며, 유사한 코드 에디터인 Windsurf는 구글과 Cognition 사이에서 팀 분할을 겪는 등 혼란스러운 인수 시도의 대상이 되기도 했습니다.

OpenAI는 GPT-5-Codex가 에이전트 코딩 능력을 측정하는 벤치마크인 SWE-bench Verified뿐만 아니라, 대규모의 기존 저장소에서 가져온 코드 리팩터링 작업을 측정하는 벤치마크에서도 GPT-5보다 우수하다고 밝혔습니다.

또한, OpenAI는 GPT-5-Codex가 코드 리뷰를 수행하도록 훈련되었으며, 경험이 풍부한 소프트웨어 엔지니어들에게 이 모델이 제시한 검토 주석(review comments)을 평가하도록 요청했습니다. 엔지니어들은 GPT-5-Codex가 부정확한 주석은 더 적게 제시하는 동시에, '고영향 주석(high-impact comments)'을 더 많이 추가한다는 사실을 발견했다고 전했습니다.

브리핑에서 OpenAI의 Codex 제품 리더인 Alexander Embiricos는 이러한 성능 향상의 상당 부분이 GPT-5-Codex의 동적 '사고 능력' 덕분이라고 설명했습니다. 사용자는 작업의 복잡성에 따라 쿼리를 다른 모델로 안내하는 ChatGPT의 GPT-5 라우터(router)에 익숙할 수 있습니다. Embiricos는 GPT-5-Codex 역시 유사하게 작동하지만, 내부 라우터가 없어 작업을 처리하는 데 필요한 시간을 실시간으로 조정할 수 있다는 점이 차별점이라고 설명했습니다.

Embiricos는 이러한 능력이 아예 처음부터 문제 해결에 사용할 컴퓨팅 파워와 시간을 결정하는 라우터 방식보다 큰 장점이라고 강조했습니다. 즉, GPT-5-Codex는 문제가 발생한 5분 후에도 추가로 한 시간을 더 투입해야 할지 스스로 결정할 수 있다는 것입니다. 그는 이 모델이 특정 사례에서는 최대 7시간 이상 소요되는 것을 목격했다고 덧붙였습니다.

[출처:] https://techcrunch.com/2025/09/15/openai-upgrades-codex-with-a-new-version-of-gpt-5