OpenAI, 추론 AI 모델 o3 및 o4-mini 출시

sw_reporter

OpenAI는 수요일에 질문을 스스로 멈추고 되짚어 생각한 후 응답하는 방식으로 설계된 새로운 AI 추론 모델인 o3와 o4-mini를 출시한다고 발표했습니다.

OpenAI는 o3를 사상 최고 수준의 추론 모델로 규정하며, 수학, 코딩, 추론, 과학, 시각적 이해 능력을 측정하는 테스트에서 회사가 이전에 선보인 모델들을 능가한다고 밝혔습니다. 한편, o4-mini는 개발자들이 애플리케이션에 AI 모델을 선택할 때 중요하게 고려하는 세 가지 요소인 가격, 속도, 성능 간의 경쟁력 있는 균형점을 제공하는 것이 특징입니다.

o3와 o4-mini는 기존 추론 모델들과 달리 웹 검색, Python 코드 실행, 이미지 처리 및 이미지 생성을 포함한 ChatGPT의 다양한 도구를 활용해 답변을 생성할 수 있습니다. 오늘부터 이 모델들은 더 높은 신뢰도를 위해 답변 구성 과정에 더 많은 시간을 할애하는 o4-mini의 변형 모델인 "o4-mini-high"와 함께 OpenAI의 Pro, Plus, Team 플랜 구독자들에게 이용 가능해졌습니다.

이 신규 모델들은 OpenAI가 치열한 글로벌 AI 경쟁에서 Google, Meta, xAI, Anthropic, DeepSeek 등을 추월하려는 노력의 일환입니다. 비록 OpenAI가 최초로 AI 추론 모델인 o1을 공개했지만, 경쟁사들은 빠르게 자체 모델 버전을 출시하여 OpenAI 라인업의 성능에 필적하거나 능가하는 추세를 보였습니다. 실제로 AI 연구소들이 시스템 성능을 극대화하려 노력하면서, 추론 능력을 갖춘 모델들이 이 분야를 주도하기 시작했습니다.

사실 o3는 ChatGPT에 출시되지 못할 뻔했습니다. OpenAI CEO 샘 알트만은 지난 2월, 회사가 o3의 기술을 통합한 더욱 정교한 대체재 개발에 자원을 집중할 계획이라고 언급한 바 있습니다. 하지만 경쟁 압박이 결국 OpenAI로 하여금 계획을 수정하게 만든 것으로 보입니다.

OpenAI에 따르면, o3는 코딩 능력을 측정하는 SWE-bench verified(맞춤형 스캐폴딩 제외) 테스트에서 69.1%를 기록하며 최고 수준의 성능을 달성했습니다. o4-mini 모델 역시 유사한 성능을 보여 68.1%를 기록했습니다. 참고로, OpenAI의 이전 모델인 o3-mini는 이 테스트에서 49.3%를 받았으며, 경쟁 모델인 Claude 3.7 Sonnet은 62.3%를 기록했습니다.

OpenAI는 o3와 o4-mini가 "이미지를 사고하는(think with images)" 최초의 모델이라고 자신합니다. 사용자는 화이트보드 스케치나 PDF에서 가져온 다이어그램과 같은 이미지를 ChatGPT에 업로드할 수 있으며, 모델은 답변을 생성하기 전 '사고의 연쇄(chain-of-thought)' 과정을 통해 이러한 이미지를 분석합니다. 이러한 능력 덕분에 o3와 o4-mini는 흐릿하거나 낮은 품질의 이미지도 이해하며, 추론하는 과정에서 이미지 확대나 회전 같은 작업을 수행할 수 있습니다.

이미지 처리 능력을 넘어, o3와 o4-mini는 ChatGPT의 Canvas 기능을 통해 사용자의 브라우저에서 Python 코드를 직접 실행할 수 있으며, 최신 사건에 대해 질문하면 웹 검색을 수행할 수도 있습니다.

ChatGPT 외에도, 세 모델 모두(o3, o4-mini, o4-mini-high)는 OpenAI의 개발자 전용 엔드포인트인 Chat Completions API와 Responses API를 통해 제공됩니다. 이를 통해 엔지니어들은 사용량 기반 요율(usage-based rates)로 해당 모델들을 활용하여 애플리케이션을 구축할 수 있습니다.

OpenAI는 o3가 성능이 개선되었음에도 불구하고 개발자들에게 상대적으로 낮은 가격인 입력 토큰당 10달러(약 75만 단어, 반지의 제왕 시리즈보다 긴 분량)와 출력 토큰당 40달러를 책정했습니다. o4-mini의 경우, o3-mini와 동일한 입력 토큰당 1.10달러, 출력 토큰당 4.40달러를 부과합니다.

한편, OpenAI는 향후 몇 주 내에 o3-pro를 출시할 계획이며, 이는 답변 생성에 더 많은 컴퓨팅 자원을 사용하는 o3의 버전으로, ChatGPT Pro 구독자에게만 독점적으로 제공됩니다.

OpenAI CEO 샘 알트만은 o3와 o4-mini가 GPT-5에 앞서 ChatGPT에서 사용될 마지막 독립형 AI 추론 모델이 될 수 있다고 밝혔습니다. 이 GPT-5는 회사가 GPT-4.1과 같은 기존 모델들과 추론 모델들을 통합할 것이라고 언급된 모델입니다.

[출처:] https://techcrunch.com/2025/04/16/openai-launches-a-pair-of-ai-reasoning-models-o3-and-o4-mini