
최근 다소 우려스러운 새로운 트렌드가 온라인에 퍼지고 있습니다. 사람들은 사진에 담긴 장소를 파악하기 위해 ChatGPT를 활용하고 있다는 것입니다.
이번 주 OpenAI가 공개한 최신 AI 모델인 o3와 o4-mini는 업로드된 이미지를 독자적으로 '추론(reason)'할 수 있는 능력을 갖추었습니다. 실제로는 모델이 사진을 잘라내거나(crop), 회전시키거나(rotate), 확대(zoom)하는 등, 초점이 흐리거나 왜곡된 사진이라도 철저하게 분석할 수 있습니다.
이러한 이미지 분석 기능에 웹 검색 능력이 결합되면서 강력한 위치 추적 도구가 탄생했습니다. X 사용자들은 특히 o3가 미묘한 시각적 단서만으로도 도시, 랜드마크는 물론 식당과 바의 위치까지도 정확하게 추론하는 능력이 뛰어나다는 것을 빠르게 발견했습니다.
"와, 완벽해. 나무 하나도 안 보이는데도."
— swax (@swax)
2025년 4월 17일
많은 경우, 모델들이 과거 ChatGPT 대화의 '기억'이나, 사진이 촬영된 위치와 같은 세부 정보를 담고 있는 메타데이터인 'EXIF 데이터'를 근거로 삼는 것으로는 보이지 않습니다.
X에는 사용자들이 ChatGPT에게 식당 메뉴판, 동네 스냅사진, 파사드(정면부) 사진, 셀카 등을 제공하며, o3에게 구글 스트리트 뷰 이미지를 보고 위치를 추측하는 온라인 게임 '지오게서(GeoGuessr)'를 하는 것처럼 상상하도록 지시하는 사례로 가득합니다.
"이건 재미있는 ChatGPT o3 기능이야. 지오게서!"
— Jason Barnes (@vyrotek)
2025년 4월 17일
이는 명백한 잠재적 사생활 침해 문제입니다. 악의적인 사용자가 누군가의 인스타그램 스토리를 스크린샷으로 찍은 후, ChatGPT를 이용해 그 사람의 신상 정보를 알아내려고(doxx) 시도하는 것을 막을 수 있는 안전장치는 없습니다.
"o3는 정말 대단해."
"친구에게 무작위 사진을 찍어달라고 부탁했어."
"걔가 도서관에서 찍은 무작위 사진을 줬는데."
"o3가 20초 만에 알고, 맞았어."
— Yumi (@izyuuumi)
2025년 4월 17일
물론 이러한 작업은 o3와 o4-mini가 출시되기 전에도 가능했을 것입니다. TechCrunch는 모델들의 장소 추측 능력을 비교하기 위해, 이미지 추론 기능이 없는 구형 모델 GPT-4o와 o3를 사용하여 여러 사진을 테스트했습니다. 놀랍게도 GPT-4o가 o3만큼이나, 아니 더 자주 같은 정답을 도출했으며 소요 시간도 더 짧았습니다.
다만 테스트 과정 중 o3가 GPT-4o가 찾아내지 못한 사례도 발견되었습니다.
(이후 내용은 원문의 흐름을 유지하며 작성)