OpenAI, 업그레이드된 이미지 생성기를 개발자들에게 공개하다

sw_reporter

OpenAI는 수요일(Wednesday) ChatGPT의 새롭고 개선된 이미지 생성 기능 기술을 API로 공개하며, 개발자들이 이 기능을 자신의 앱과 서비스에 통합할 수 있도록 했습니다.

지난 3월 말 대다수 ChatGPT 사용자에게 공개된 OpenAI의 새로운 이미지 생성기는 사실적인 지브리 스타일 사진과 "AI 액션 피규어" 제작 능력으로 큰 화제를 모았습니다. 이는 OpenAI에게 양날의 검으로 작용하여, ChatGPT 신규 가입자를 수백만 명 증가시키는 동시에 회사의 처리 용량에 막대한 부담을 안겼습니다. 회사에 따르면, 1억 3,000만 명이 넘는 ChatGPT 사용자들이 이 도구가 이용 가능했던 첫 주에만 7억 장 이상의 이미지를 생성했습니다.

OpenAI의 API에서 이미지 생성 기능은 "gpt-image-1"이라는 AI 모델을 기반으로 구동됩니다. 네이티브 멀티모달 모델인 gpt-image-1은 다양한 스타일의 이미지를 생성하고, 사용자 지정 가이드라인을 따르며, 광범위한 세계 지식을 활용하고, 텍스트를 렌더링할 수 있습니다.

개발자들은 gpt-image-1을 활용해 여러 이미지를 한 번에 생성할 수 있으며, 이를 통해 생성 품질은 물론 속도까지 제어할 수 있습니다.

OpenAI에 따르면, gpt-image-1은 ChatGPT의 이미지 생성에 적용되는 것과 동일한 안전 가드레일(safety guardrails)을 사용하며, 여기에는 회사의 정책에 위배되는 콘텐츠 생성을 제한하는 보호 장치가 포함됩니다. 개발자들은 검열 민감도(moderation sensitivity)를 제어할 수 있는데, 표준 필터링을 위한 "자동(auto)" 또는 덜 제한적인 필터링을 위한 "낮음(low)"으로 설정할 수 있습니다. TechCrunch에 제공된 OpenAI 문건에 의하면, 낮은 필터링 설정은 잠재적으로 부적절할 수 있는 콘텐츠의 범주를 더 적게 제한합니다.

또한 OpenAI는 gpt-image-1으로 생성된 모든 이미지는 C2PA 메타데이터로 워터마크 처리되어, 지원되는 플랫폼 및 앱에서 AI 생성물로 식별될 수 있다고 밝혔습니다.

가격 정책은 다음과 같습니다. 텍스트 입력 토큰당 백만 개에 $5, 이미지 입력 토큰당 백만 개에 $10, 그리고 이미지 출력 토큰당 백만 개에 $40입니다. (토큰은 모델이 처리하는 원시 데이터 단위입니다.) OpenAI에 따르면, 이 비용은 낮은, 중간, 높은 품질의 정사각형 이미지 1장당 각각 약 2센트, 7센트, 19센트에 해당합니다.

OpenAI는 Adobe, Airtable, Wix, Instacart, GoDaddy, Canva, Figma 등 여러 기업들이 이미 gpt-image-1을 사용하거나 실험하고 있다고 전했습니다. 예를 들어, Figma의 Figma Design 플랫폼은 이제 사용자가 gpt-image-1을 통해 이미지를 생성하고 편집할 수 있게 되었으며, Instacart는 레시피와 쇼핑 목록에 활용할 이미지를 위해 이 모델을 테스트하고 있습니다.

[출처:] https://techcrunch.com/2025/04/23/openai-makes-its-upgraded-image-generator-available-to-developers