구글의 실험 플랫폼인 구글 랩스(Google Labs)가 'Whisk'라는 새로운 이미지 생성기를 테스트하고 있습니다. 이 도구는 텍스트 대신 이미지를 프롬프트로 활용하여 사용자가 사진을 리믹스(remix)할 수 있도록 하며, 이를 통해 주제, 배경, 스타일을 변경할 수 있습니다.
Whisk는 구글의 이미지 생성 모델인 Imagen 3을 활용하여 세 가지 이미지(주제, 배경, 스타일)를 결합합니다. 예를 들어, 사용자 본인의 사진을 주제로, 미래적인 풍경을 배경으로, 애니메이션 스타일로 최종 결과물을 만들 수 있습니다.
이 모델은 사용자가 업로드한 이미지들에 대한 상세한 캡션을 자동으로 생성하고, 이 캡션을 기반으로 Imagen 3이 사진 리믹스 작업을 수행하도록 안내합니다. 또한, "주제가 비행하는 자전거를 타고 있는 모습"과 같은 구체적인 설명을 담은 텍스트 프롬프트를 입력하여 원하는 결과물을 더욱 상세하게 지정할 수도 있습니다.
다만, Whisk가 각 이미지의 몇 가지 핵심적인 특성만을 추출하여 사용하기 때문에, 결과물이 항상 사용자의 기대와 다를 수 있습니다. 예를 들어, 생성된 주제의 경우 키, 체중, 헤어스타일, 또는 피부 톤 등이 다르게 나타날 수 있습니다. 구글 측에 따르면, 사용자는 언제든지 기반이 되는 원본 프롬프트를 확인하고 수정할 수 있습니다.
현재 이 실험 기능은 미국 거주 사용자에게만 labs.google/whisk를 통해 제공됩니다.