그록 3, 트럼프 및 머스크 관련 부정적 언급 일시 검열한 것으로 보임

sw_reporter

억만장자 일론 머스크가 지난 월요일 라이브 스트리밍에서 자사의 AI 회사 xAI의 최신 플래그십 모델인 Grok 3를 소개하며 이를 "최대한 진실을 추구하는 AI"라고 설명했다. 하지만 Grok 3가 도널드 트럼프 대통령과 머스크에 관한 불리한 사실들을 일시적으로 검열한 정황이 포착되었다.

주말 동안 소셜 미디어 사용자들은 "가장 큰 허위 정보 유포자는 누구입니까?"라는 질문에 대해 'Think' 설정을 활성화했을 때, Grok 3가 자체적인 '사고 과정(chain of thought)'을 통해 도널드 트럼프나 일론 머스크를 언급해서는 안 된다고 명시적으로 지시받았다는 보고를 했다. 여기서 사고 과정이란 모델이 질문에 답하기 위해 거치는 '추론' 과정을 의미한다.

TechCrunch는 이러한 행태를 한 번 재현하는 데 성공했지만, 일요일 아침 기사 작성 시점까지 Grok 3는 허위 정보 관련 질문에 대한 답변에서 다시 도널드 트럼프를 언급했다.

xAI 엔지니어링 리드인 이고르 바부시킨(Igor Babuschkin)은 일요일 X(구 트위터)에 올린 게시물에서, Grok가 머스크나 트럼프가 허위 정보를 유포하는 내용을 언급하는 출처는 무시하도록 잠시 지시받은 사실을 시사했다. 바부시킨은 사용자들이 이를 지적하기 시작하자마자 xAI 측이 이 변경 사항을 되돌렸으며, 이는 회사 가치관에 부합하지 않는 것이었다고 설명했다.

“시스템 프롬프트를 공개하는 것이 좋다고 생각합니다. 사람들이 Grok에게 무엇을 요청하고 있는지 검증할 수 있어야 합니다. 이번 사례처럼 한 직원이 도움이 될 것이라고 생각해서 이 변경을 추진했지만, 이는 명백히 우리의 가치관에 부합하지 않습니다. 우리는…”
— Igor Babuschkin (@ibab)
2025년 2월 23일

‘허위 정보’ 자체가 정치적으로 민감하고 논란이 되는 범주일 수 있으나, 트럼프와 머스크 모두 명백히 사실이 아닌 주장들을 반복적으로 제기해왔다(이는 머스크가 소유한 X의 커뮤니티 노트에서 자주 지적된 바 있다). 지난 일주일 동안만 두 사람은 우크라이나 대통령 볼로디미르 젤렌스키(Volodymyr Zelenskyy)가 4%의 낮은 지지율을 가진 "독재자"이며, 우크라이나가 러시아와의 분쟁을 시작했다는 허위 서사를 전개한 바 있다.

Grok 3에 대한 이러한 논란의 조정은 일부 사람들이 이 모델을 지나치게 좌파적이라고 비판하는 시점에 발생했다. 이번 주 사용자들은 Grok 3가 도널드 트럼프 대통령과 머스크가 사형에 처해져 마땅하다고 일관되게 발언하는 것을 발견하기도 했다. xAI는 이 문제를 빠르게 패치했으며, 회사의 엔지니어링 책임자인 이고르 바부시킨은 이를 "정말 끔찍하고 심각한 실패"라고 평가했다.

머스크는 Grok을 약 2년 전 처음 공개할 때, 이 AI 모델을 자극적이고 필터링되지 않았으며, "반(反)깨어있는(anti-woke)" 특성을 지닌 것으로 홍보했다. 즉, 일반적으로 다른 AI 시스템들이 답변을 꺼리는 논란성 질문에도 답할 준비가 되어 있다는 점을 강조한 것이다. 실제로 Grok은 그 약속 중 일부를 이행했다. 예를 들어, 저속한 표현을 요구했을 때 Grok과 Grok 2는 기꺼이 응답하며, 사용자가 ChatGPT에서는 듣기 어려울 법한 다채로운 언어를 쏟아냈다. 하지만 Grok 3 이전 모델들은 정치적인 주제에 대해서는 신중함을 기했으며 특정 경계를 넘지 않았었다. 실제로 한 연구에 따르면 Grok은 트랜스젠더 권리, 다양성 프로그램, 불평등 등 특정 주제에 대해 정치적으로 좌파 성향을 띠는 것으로 분석되기도 했다.

머스크는 이러한 모델의 행동이 Grok의 학습 데이터, 즉 일반 웹 페이지의 영향 때문이라고 책임을 전가하며, 이를 개선하여 Grok를 "정치적으로 중립적인 방향으로 이동시킬 것"이라고 약속했다. OpenAI를 포함한 다른 기업들 역시 같은 행보를 보이기도 했는데, 이는 트럼프 행정부가 보수적 검열을 받았다는 주장과도 관련이 있다.

한편, AI 기술은 콘텐츠 생성부터 배포에 이르는 전 과정에 혁신을 가져오며 기술 기업들에게 새로운 수익 모델과 막대한 도전 과제를 던지고 있다.

특히 X(구 트위터)와 같은 플랫폼들은 사용자에게 추천 콘텐츠를 제공하여 더 많은 사용자를 유입시키기 위해 인공지능을 활용하는 데 주력하고 있다. X는 사용자 경험을 개선하는 여러 기능을 도입하고 있다. 예를 들어, 사진 속 글자를 텍스트로 인식하거나, 동영상에서 특정 사물을 검색하는 기능 등이 이에 해당한다. 이러한 기능들은 사용자가 플랫폼에 머무는 시간을 늘리고, 결과적으로 광고 노출 기회를 극대화하는 효과를 가져올 것으로 보인다.

하지만 X는 콘텐츠 검열 및 규제와 관련해서도 끊임없이 논란의 중심에 서 있다. 플랫폼은 사용자 콘텐츠에 대한 가이드라인을 설정하고 준수를 요구하며, 때로는 지나친 통제라는 비판을 받기도 한다.

[출처:] https://techcrunch.com/2025/02/23/grok-3-appears-to-have-briefly-censored-unflattering-mentions-of-trump-and-musk