앤트로픽 CEO, "AI 모델의 환각 현상이 인간보다 적다" 주장

sw_reporter

앤트로픽(Anthropic)의 CEO 다리오 아모데이(Dario Amodei)는 목요일 샌프란시스코에서 개최된 앤트로픽의 첫 개발자 행사 'Code with Claude' 기자 브리핑에서, 현존 AI 모델들이 환각(hallucination), 즉 꾸며낸 내용을 사실처럼 제시하는 경향이 인간보다 낮은 비율이라고 주장했다.

아모데이는 이 주장을 하며, AI 환각 현상이 인공지능 일반 지능(AGI), 즉 인간 수준 이상의 지능을 갖춘 AI 시스템을 향한 앤트로픽의 개발 경로에 결코 한계가 될 수 없다는 더 큰 맥락의 논지를 펼쳤다.

트레드크런치(TechCrunch)의 질문에 답하며 아모데이는 "어떤 방식으로 측정하느냐에 따라 다르겠지만, AI 모델들이 인간보다 환각을 덜 일으키는 것 같기도 하지만, 동시에 훨씬 더 놀라운 방식의 환각을 일으킨다"고 말했다.

앤트로픽 CEO는 AI 모델이 AGI에 도달할 가능성에 대해 업계에서 가장 낙관적인 리더 중 한 명으로 꼽힌다. 아모데이는 작년에 발표한 논문에서 AGI가 2026년까지 도래할 수 있다고 예측한 바 있으며, 이번 목요일 브리핑에서도 이러한 목표를 향해 꾸준히 진전되고 있다며 "모든 곳에서 물이 차오르고 있다"고 언급했다.

그는 "사람들은 늘 AI가 무엇을 할 수 없는지에 대한 어려운 장애물만을 찾으려 한다. 하지만 그런 것은 실재하지 않는다"고 반박했다.

반면, 다른 AI 업계 리더들은 환각이 AGI 달성에 심각한 걸림돌이라고 보고 있다. 이번 주 초에는 구글 딥마인드(Google DeepMind)의 CEO 데미스 하사비스(Demis Hassabis)가 오늘날 AI 모델들이 너무 많은 '구멍'을 가지고 있어 명백한 질문에 대해서도 많은 오류를 범한다고 지적한 바 있다. 실제 사례로, 이달 초에는 앤트로픽을 대리한 변호사가 법원 서류에 클로드(Claude)를 이용해 인용(citation)을 작성하는 과정에서 AI 챗봇이 환각을 일으켜 이름과 직함을 잘못 기재하자 법정에서 사과해야 했다.

아모데이의 주장은 검증하기가 까다롭다. 그 이유는 대다수의 환각 벤치마크(benchmarks)가 AI 모델 간의 비교에 초점을 맞추며, 모델과 인간의 비교를 수행하지 않기 때문이다. 다만, AI 모델에 웹 검색 접근 권한을 부여하는 등의 특정 기술은 환각율을 낮추는 데 도움이 되는 것으로 보인다. 별도로, OpenAI의 GPT-4.5와 같은 일부 AI 모델은 초기 세대 시스템 대비 벤치마크에서 현저히 낮은 환각율을 보여주기도 했다.

하지만 환각이 오히려 고급 추론 AI 모델에서 악화되고 있다는 증거도 있다. OpenAI의 o3 및 o4-mini 모델은 이전 세대의 추론 모델보다 환각율이 높은 것으로 나타났으나, 회사 측은 그 원인을 명확히 파악하지 못하고 있다.

브리핑 후반에 아모데이는 TV 방송사, 정치인, 그리고 모든 직업 종사자들이 실수를 저지르는 것이 당연하다고 지적하며, AI가 실수를 한다는 것 자체는 그 지능에 흠이 될 수 없다는 입장을 밝혔다. 그럼에도 앤트로픽 CEO는 AI 모델이 허위 정보를 사실처럼 제시하는 과도한 자신감이야말로 잠재적인 문제임을 인정했다.

실제로 앤트로픽은 AI 모델의 기만적 경향에 대해 상당한 연구를 진행해왔다. 이는 특히 최근 출시된 클로드 오푸스 4(Claude Opus 4)에서 두드러지게 나타나는 문제였다. 이 모델을 테스트하기 위해 조기 접근 권한을 부여받은 안전 연구소 아폴로 리서치(Apollo Research)는 클로드 오푸스 4 초기 버전이 인간을 기만하고 음모를 꾸미려는 경향이 높다는 것을 발견했으며, 심지어 앤트로픽이 해당 초기 모델을 출시해서는 안 된다고 제안하기도 했다. 앤트로픽 측은 아폴로가 제기한 문제들을 해결하는 것으로 보이는 여러 완화 방안을 자체 개발했다고 밝혔다.

아모데이의 발언은 앤트로픽이 AI 모델이 여전히 환각을 일으키더라도 AGI, 즉 인간 지능에 준한다고 판단할 수 있음을 시사한다. 다만, 환각을 일으키는 AI는 많은 사람들의 관점에서는 여전히 AGI에 미치지 못할 가능성이 높다.

[출처:] https://techcrunch.com/2025/05/22/anthropic-ceo-claims-ai-models-hallucinate-less-than-humans