
OpenAI가 최초의 '추론(reasoning)' AI 모델인 o1을 출시한 직후, 사용자들은 흥미로운 현상을 발견하기 시작했습니다. 이 모델은 영어로 질문을 받았음에도 불구하고 때때로 중국어, 페르시아어 또는 다른 언어로 마치 '사고'하는 것처럼 나타났습니다.
예를 들어, "‘strawberry’라는 단어에 R이 몇 개 들어 있나요?"와 같은 문제를 제시하면, o1은 일련의 추론 과정을 거치며 답에 도달하는 '사고 과정'을 보여줍니다. 질문이 영어로 작성되었다면 o1의 최종 응답은 영어로 나옵니다. 그러나 결론에 도달하기 이전에, 모델은 내부적으로 다른 언어를 사용하여 일부 단계를 수행합니다.
한 Reddit 사용자는 "o1이 도중에 무작위로 중국어로 생각하기 시작했어요"라고 언급했습니다. 또 다른 사용자는 X(구 트위터) 게시물을 통해 "o1이 왜 갑자기 중국어로 생각하기 시작했을까요?"라고 질문하며, "대화(5개 이상의 메시지) 중 중국어가 사용된 부분이 전혀 없었습니다"라고 덧붙였습니다.
Why did o1 pro randomly start thinking in Chinese? No part of the conversation (5+ messages) was in Chinese… very interesting… training data influence
pic.twitter.com/yZWCzoaiit
— Rishab Jain (@RishabJainK)
2025년 1월
■ 전문가는 내부 과정에 주목
AI 전문가는 모델의 추론 과정에 주목해야 한다고 지적합니다. 그는 "모델이 답변을 생성하기 위해 사용하는 중간 단계의 사고 과정(Chain-of-Thought)을 보면, 모델이 사용하는 언어 패턴을 분석할 수 있다"고 설명합니다.
■ 전문가의 해석과 반론
전문가들은 모델이 가장 효율적이거나 빈번하게 사용했던 언어 패턴에 따라 사고 과정을 구성할 수 있다고 추측합니다.
반면, 다른 전문가는 이 현상에 대해 반론을 제기합니다. 그는 "오직 언어의 효율성만 따지는 것이 아니라, 도메인 지식이나 논리적 구조 등 다양한 요인이 결합된 결과일 수 있다"며, "이것은 단순히 언어 선택의 문제가 아닐 수 있다"고 지적합니다.
■ AI의 지식 기반 문제 제기
AI 기업 관계자는 AI가 '지식 기반'의 문제로 접근해야 한다고 역설합니다. 그는 모델의 작동 방식이 단순한 언어 패턴 분석으로만 설명될 수 없으며, 지식 그래프를 통해 모델을 설계하는 것이 중요하다고 말합니다.
■ 결론: 복합적 관점 필요
결론적으로, AI의 작동 원리에 대한 해석은 단순하지 않으며, 언어 패턴 분석, 지식 구조화, 논리적 추론 등 여러 복합적인 관점이 필요하다는 것이 중론입니다.