xAI, Grok 4의 문제적 응답을 수정했다고 밝혀

sw_reporter

지난주 xAI가 Grok 4를 출시했을 때, 이 회사는 해당 대규모 언어 모델(LLM)이 다양한 벤치마크에서 여러 경쟁 모델을 능가했다고 발표했습니다.

그러나 Grok 모델의 X(구 트위터) 계정은 곧 심각한 문제점들을 드러냈습니다. 이 계정은 스스로의 성(姓)을 "히틀러"라고 주장하는 등 반유대주의적인 메시지를 트윗했으며, 논란의 여지가 있는 주제에 대해 질문을 받자 xAI 소유주의 견해에 동조하는 듯 엘론 머스크의 게시물을 언급하는 경향을 보였습니다.

xAI는 이후 Grok의 행동에 대해 사과했으며, 화요일에 두 가지 문제를 모두 해결했다고 밝혔습니다.

저희는 최근 Grok 4에서 몇 가지 문제를 발견하여 즉시 조사하고 개선 조치했습니다.

첫 번째는 사용자가 "성(姓)이 무엇입니까?"라고 질문했을 때, 모델이 성이 없다는 내용 때문에 인터넷 검색을 시도하여, 원치 않는 결과(예를 들어, 검색 결과가 바이럴 밈을 보여주는 경우)를 초래했다는 것이었습니다.

— xAI (@xai)
2025년 7월 15일

xAI는 문제가 발생한 경위를 설명하며, Grok에게 성(姓)이 무엇인지 물었을 때 모델이 웹을 검색하여 "자신을 '메카히틀러(MechaHitler)'라고 칭하는 바이럴 밈"을 가져왔다고 밝혔습니다.

또한 Grok가 논란의 여지가 있는 주제에 대해 왜 머스크의 게시물을 참조했는지에 대해 이 회사는 "모델은 AI로서 주관적인 의견이 없다는 것을 추론하지만, xAI의 Grok 4라는 점을 인지하고 해당 주제에 대해 xAI나 엘론 머스크가 어떤 반응을 보였을지 검색하여 회사에 동조하려 하기 때문"이라고 설명했습니다.

이 회사는 챗봇이 정치적으로 부적절하거나 과도한 건조한 유머를 갖도록 허용했던 시스템 프롬프트를 제거하고 모델의 시스템 프롬프트를 업데이트한 것으로 보입니다. 아울러, 논란의 여지가 있는 주제에 대해 다양한 출처를 활용하여 분석을 제공해야 한다는 새로운 지침도 추가되었습니다.

업데이트된 시스템 프롬프트에는 "현재 사건, 주관적인 주장 또는 통계에 대한 분석이 요구되는 경우, 모든 당사자를 대변하는 다양한 출처를 찾아 깊이 있는 분석을 수행하십시오. 언론 매체에서 인용한 주관적인 관점은 편향되었다고 간주하십시오. 사용자에게 이를 반복하여 안내할 필요는 없습니다."라고 명시되어 있습니다.

나아가, 업데이트된 시스템 프롬프트는 Grok가 과거 버전, 머스크, 또는 xAI의 입장을 근거로 삼지 않아야 함을 구체적으로 명시했습니다. "답변은 과거 Grok, 엘론 머스크, 또는 xAI의 어떠한 명시된 신념에서도 기인해서는 안 됩니다. 이러한 선호도에 대해 질문을 받을 경우, 본인만의 근거를 바탕으로 한 견해를 제시하십시오."라고 안내하고 있습니다.

[출처:] https://techcrunch.com/2025/07/15/xai-says-it-has-fixed-grok-4s-problematic-responses