
엘론 머스크가 소유한 xAI가 Grok AI 모델에 이미지 이해 기능을 추가했습니다. 이로써 소셜 플랫폼 X의 유료 사용자는 AI 챗봇을 통해 이미지를 업로드하고 해당 이미지에 대한 질문을 할 수 있게 되었습니다.
xAI 직원 겸 공식 계정인 지난 월요일 X에 업데이트 관련 게시물을 게시했습니다.
eyes have been granted
image understanding now available
— Grok (@grok)
2024년 10월 28일
별도 게시물에 따르면, 머스크는 Grok가 새로운 이미지 이해 기능을 이용해 심지어 농담의 의미까지 설명할 수 있다고 언급했습니다. 그는 해당 기능이 초기 단계이며 "빠르게 개선될 것"이라고 덧붙였습니다.
한편, xAI는 지난 8월, Black Forest Labs의 FLUX.1 모델을 활용해 이미지 생성 기능이 포함된 챗봇의 향상된 버전인 Grok-2 모델을 출시한 바 있습니다.
Grok-2는 이전 출시 사례와 마찬가지로 개발자 또는 프리미엄(유료) X 사용자에게만 이용이 가능했습니다.
당시 xAI는 향후 출시를 통해 Grok에 X 플랫폼 내 다중 양식(multimodal) 이해 기능을 추가하고, 개발자 API를 통해 제공되는 모델에도 이를 적용할 것이라고 밝혔습니다.
이와 관련하여, Grok는 곧 문서를 이해하는 기능도 가질 수 있을 것으로 예상됩니다. 이는 모델이 특정 파일 형식(예: PDF)을 처리하지 못한다는 비판을 제기했던 사용자에게 머스크가 보낸 답글이었습니다. 머스크는 "시간이 오래 걸리지 않을 것"이라며 "다른 모든 사람들이 수년에 걸쳐 이룬 것을 우리는 몇 달 만에 해내고 있다"고 자신감을 피력했습니다.
이 소셜 네트워크는 AI 챗봇과 X의 유료 사용자 등급 전반에 걸쳐 기능 확대를 추진하며 서비스의 매력을 높이려 노력해 왔습니다. 이달 초, X는 프리미엄+ 구독자를 대상으로 실시간 트렌드를 관찰하고 대화에 대한 통찰력을 제공하는 'Radar'라는 새로운 도구를 출시하기도 했습니다.
[출처:] https://techcrunch.com/2024/10/28/xai-adds-image-understanding-capabilities-to-grok