OpenAI가 더 나은 명령어 준수 능력, 더욱 정밀한 편집 기능, 그리고 최대 4배 빨라진 이미지 생성 속도를 제공하는 ChatGPT Images의 새 버전을 공개합니다.
GPT Image 1.5로 명명된 이 신규 모델은 화요일부터 모든 ChatGPT 사용자 및 API를 통해 이용 가능합니다. 이번 발표는 지난달 OpenAI CEO 샘 올트먼(Sam Altman)이 유출된 내부 메모에서 '코드 레드(code red)'를 선언한 이후 이어진 구글의 Gemini와의 경쟁 심화에 따른 것입니다. 해당 메모에는 구글이 최신 플래그십 모델인 Gemini 3와 구글의 바이럴 이미지 생성기 최신 버전인 Nano Banana Pro를 출시하여 시장 점유율을 확대하자, AI 리더십을 되찾기 위한 OpenAI의 계획이 상세히 담겨 있었습니다. 이 두 모델 모두 다수의 벤치마크에서 LMArena 리더보드 상위를 차지했습니다.
이러한 흐름에도 불구하고, 구글은 우위를 유지하고 있습니다. OpenAI가 지난주 GPT-5.2를 출시하며 구글의 성공에 대응했으나, 구글의 입지가 여전히 견고합니다. OpenAI는 이 모델을 개발자 및 일반 전문가 사용자 모두를 위한 현존 최고 사양 모델로 홍보했습니다. OpenAI는 당초 이르면 1월 초에 새로운 이미지 생성기를 출시할 계획이었으나, 이번 주 발표로 일정을 앞당긴 것입니다. 이전에 출시된 이미지 모델은 4월의 GPT Image 1이었습니다.
GPT Image 1.5는 이미지 및 비디오 생성 기술이 단순한 프로토타입 단계를 넘어 실제로 활용 가능한 수준(production-ready capabilities)으로 발전함에 따라 등장했습니다. ChatGPT Image는 포스트 프로덕션(post-production) 기능을 제공하여, 편집 전반에 걸쳐 얼굴 유사성(facial likeness), 조명, 구도, 색조(color tone) 등 시각적 일관성(visual consistency)을 유지할 수 있는 정교한 편집 제어를 지원합니다.
(참고: 본문에는 동일한 이미지를 보여주며 GPT Image 1.5의 향상된 명령어 준수 능력을 비교하는 이미지가 포함되어 있습니다.)
대부분의 GenAI 이미지 도구는 '반복적인 수정(iteration)' 작업에 취약한 경향이 있었기 때문에, 이번 개선은 큰 진전입니다. 사용자가 "표정 조정하기"나 "조명을 더 차갑게 만들기"와 같은 구체적인 변경을 요청할 때, 기존 모델들은 종종 전체 이미지를 재해석하는 바람에 일관성이 부족해지는 문제가 발생했습니다.
이번 업데이트는 단순히 신규 기능에 국한되지 않습니다. OpenAI 애플리케이션 CEO인 피지 시모(Fidji Simo)에 따르면, ChatGPT 이미지는 이제 "크리에이티브 스튜디오와 유사한(more like a creative studio)" 전용 진입점을 통해 접근 가능하게 됩니다. 시모는 블로그 게시물에서 "새로운 이미지 보기 및 편집 화면을 통해 사용자의 비전에 맞는 이미지를 생성하거나 트렌디한 프롬프트 및 프리셋 필터에서 영감을 얻는 것이 더 쉬워졌다"고 밝혔습니다.
새로운 이미지 생성 기능 외에도, OpenAI는 더 다양한 시각적 요소를 추가하여 ChatGPT 경험을 개선할 계획을 발표했습니다. 시모에 따르면, 검색 쿼리가 더 명확한 출처와 함께 더 많은 시각 자료를 표시하도록 개선하는 것이 포함되며, 이는 측정 단위 변환이나 스포츠 점수 확인 같은 작업에 유용할 수 있습니다.
시모는 "무언가를 만들 때, 사용자는 자신이 만드는 것을 시각적으로 보고 형태를 잡을 수 있어야 합니다. 시각 자료가 단지 단어만으로 이야기하는 것보다 더 잘 전달할 때, ChatGPT에 이를 포함해야 합니다. 간단한 답변이 필요하거나 다음 단계가 다른 도구에 존재하는 경우에도 바로 접근할 수 있어야 합니다. 이처럼 기능을 개선함으로써, 우리는 사용자의 마음속 아이디어와 그것을 현실로 구현하는 능력 사이의 거리를 지속적으로 좁힐 수 있습니다"라고 강조했습니다.
pic.twitter.com/PwG1F4TT6Q
— OpenAI (@OpenAI)
2025년 12월 16일