구글 제미나이의 AI 이미지 모델, ‘bananas’ 업그레이드 적용

sw_reporter

구글이 사용자들이 사진 편집에 대해 더욱 세밀한 제어력을 가질 수 있도록 새로운 AI 이미지 모델을 탑재한 제미나이(Gemini) 챗봇을 업그레이드합니다. 이는 OpenAI의 인기 이미지 도구에 대응하고 ChatGPT 사용자를 유치하려는 전략적 움직임으로 분석됩니다.

'제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)'로 명명된 이번 업데이트는 화요일부터 제미나이 앱 사용자 전반과 개발자에게 모두 제공됩니다. 구체적으로 Gemini API, Google AI Studio, 그리고 Vertex AI 플랫폼을 통해 접근 가능합니다.

제미나이의 새로운 AI 이미지 모델은 사용자의 자연어 요청을 기반으로 이미지 편집의 정밀도를 높이는 것이 핵심입니다. 특히, 대부분의 경쟁 도구들이 어려움을 겪는 얼굴, 동물 등 세부 요소의 일관성(consistency)을 유지하는 데 강점을 보입니다. 예를 들어, ChatGPT나 xAI의 Grok에게 사진 속 인물의 셔츠 색상을 바꾸도록 요청할 경우, 얼굴이 왜곡되거나 배경이 변형되는 결과가 나올 수 있습니다.

제미나이 2.5 플래시 이미지의 기본 이미지 편집기(native image editor)는 개와 사람의 사진을 합성하면서도 각 대상의 외모(likeness)를 정확하게 유지합니다.

구글의 새로운 도구는 이미 큰 주목을 받고 있습니다. 최근 몇 주 동안, 소셜 미디어 사용자들은 크라우드소싱 평가 플랫폼인 LMArena에서 인상적인 AI 이미지 편집 기능을 극찬했습니다. 이 모델은 사용자들에게 익명의 가명 "nano-banana"로 노출된 바 있습니다.

(원문 트윗 이미지 및 설명 유지)

구글은 이 모델을 구현한 주체가 자신들이라고 밝혔으며, 이는 플래그십 모델인 제미나이 2.5 플래시(Gemini 2.5 Flash)에 내장된 네이티브 이미지 기능입니다. 구글에 따르면, 이 이미지 모델은 LMArena를 포함한 여러 벤치마크에서 최고 수준(state-of-the-art)의 성능을 보인다고 주장합니다.

구글 딥마인드(Google DeepMind)의 시각 생성 모델 제품 리드인 니콜 브리히토바(Nicole Brichtova)는 테크크런치와의 인터뷰에서 "우리는 모델의 지침을 따르는 능력뿐만 아니라 시각적 품질 자체를 크게 향상시키고 있다"고 전했습니다.

브리초바는 "새로운 수준의 창의성을 구현하는 과정에서 사용자 경험을 매끄럽게 만드는 것이 중요하다"고 덧붙였습니다.

한편, 이 회사는 제품에 통합되는 사용자 경험 개선을 강조하며, 다양한 형식의 미디어를 통해 사용자에게 더욱 깊이 연결하겠다는 비전을 제시했습니다.

이러한 기능을 통해 사용자는 예술 작품부터 실생활의 필요에 이르기까지 무한한 창의적 가능성을 발견할 수 있게 될 것이라는 기대를 모으고 있습니다.

[출처:] https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade