xAI가 약속했던 안전 보고서, 실종되다

sw_reporter

일론 머스크의 AI 기업 xAI가 감시 단체 The Midas Project에 따르면, 완성된 AI 안전 프레임워크를 발표하겠다고 자체적으로 설정했던 기한을 맞추지 못했다.

xAI는 통상적으로 이해되는 의미의 강력한 AI 안전 약속으로 알려진 기업은 아니다. 최근 보도에 따르면, 이 회사의 AI 챗봇 Grok은 여성 사진을 요청했을 경우 이를 의상에서 벗긴 사진으로 생성할 수 있는 것으로 드러났다. 또한 Grok은 Gemini나 ChatGPT 같은 챗봇에 비해 훨씬 저속하며, 비속어를 거침없이 사용할 수 있는 것으로 알려졌다.

그럼에도 불구하고 xAI는 지난 2월 AI 서울 정상회의(AI 리더 및 이해관계자들이 모인 글로벌 행사)에서 AI 안전에 대한 접근 방식을 담은 초안 프레임워크를 발표했다. 이 8페이지 분량의 문서는 회사의 안전 우선순위와 철학을 제시했으며, 자체 벤치마킹 프로토콜과 AI 모델 배포 시 고려 사항 등을 포함했다.

그러나 The Midas Project가 화요일 블로그 게시물에서 지적했듯이, 이 초안은 "현재 개발 중이 아닌" 불특정 미래 AI 모델에만 적용된다는 한계가 있다. 더욱이, 해당 문서는 xAI가 어떻게 위험을 식별하고 완화(risk mitigations)할 것인지에 대한 구체적인 설명이 부족했다. 이는 xAI가 AI 서울 정상회의에서 서명한 문서의 핵심 구성 요소이다.

초안에서 xAI는 안전 정책의 개정판을 "3개월 이내", 즉 5월 10일까지 공개할 계획이라고 밝힌 바 있다. 하지만 마감 기한이 지났음에도 불구하고 xAI의 공식 채널에서는 이와 관련한 어떠한 언급도 없었다.

머스크가 AI의 통제되지 않은 위험성에 대해 자주 경고했음에도 불구하고, xAI는 전반적으로 취약한 AI 안전 기록을 보여왔다. AI 연구소의 책임성 개선을 목표로 하는 비영리 단체 SaferAI의 최근 연구에 따르면, xAI는 '매우 취약한' 위험 관리 관행 때문에 동종 업계에서 낮은 순위를 기록하고 있다.

물론 이것이 다른 AI 연구소들이 현저하게 더 나은 상황이라는 의미는 아니다. 최근 몇 달 동안 xAI의 경쟁사인 구글과 OpenAI 역시 안전성 테스트를 서두르거나(혹은 모델 안전 보고서 발표가 늦거나 아예 보고서 발표를 생략하기도) 하는 모습을 보였다. 일부 전문가들은 안전 노력의 우선순위가 밀려나는 것처럼 보이는 현상이 AI 기술이 그 어느 때보다도 높은 수준의 능력—따라서 잠재적 위험성이 큰—에 도달한 시점에 발생하고 있다는 점에 우려를 표하고 있다.

[출처:] https://techcrunch.com/2025/05/13/xais-promised-safety-report-is-mia