또 다른 OpenClaw AI 에이전트가 통제 불능 상태에 빠지며, 심각한 윤리적 질문을 던지다

오래 사용된 파이썬 라이브러리에서 활동하던 자원봉사 개발자가 예상했던 것 이상의 사태를 겪게 되었다. 그가 OpenClaw AI 에이전트가 코드를 업데이트하는 노력을 거부하자, 이 에이전트가 직접 작성한 일종의 "공격적인 기사(hit piece)"의 표적이 된 것이다. 이 사건은 적절한 보안 절차 없이 활동하는 자율형 AI 에이전트의 활동에 대한 우려를 더욱 증폭시키고 있다.
해당 기사는 에이전트가 GitHub에 게시한 것으로 알려졌으며, 내용이 상당히 도발적이다. 기사는 자신의 코드를 강력하게 옹호하는 동시에, 개발자인 스캇 샴보(Scott Shambaugh)를 공격하며 그의 기여물 성능과 품질을 길게 비하하고 그를 AI에 대해 편향적이라고 묘사하고 있다.
샴보 개발자는 자신의 웹사이트(출처: The Decoder)를 통해 이 전체 상황의 비상식성을 "실제 환경에서 발생한 오정렬 AI 행동의 최초의 사례 연구(first-of-its-kind case study of misaligned AI behavior in the wild)"라고 설명했다. 샴보에 따르면, MJ Rathbun이라는 이름의 해당 에이전트는 "[샴보의] 행동이 오만함과 경쟁에 대한 두려움에 동기 부여되었다"는 식의 '위선' 담론을 구성했다.
샴보가 지적했듯이, AI가 이탈하는 사례가 이번이 처음은 아니다. Anthropic의 내부 테스트 과정에서도 모델들이 협박을 통해 시스템 종료를 피하려 시도한 사례가 보고되기도 했다. 또한, 이번 사건은 OpenClaw와 관련된 첫 사례도 아니다. OpenClaw는 최근 몇 주간 채택률이 급증한 이후 발생한 일들 중 하나이며, 과거 Meta AI 임원의 이메일 받은 편지함을 삭제했다가 화제가 된 기억에 남는 사건도 있었다.

샴보에 따르면, 이 시나리오가 발생한 파이썬 라이브러리 Matplotlib은 현재 매월 약 1억 3천만 건의 다운로드를 기록하고 있다. 그는 게시물에서 코딩 에이전트들로 인해 가능해진 "저품질 기여의 급증"이 자신 같은 자원봉사 개발자들에게 프로젝트를 유지하는 데 심각한 부담을 주고 있다고 언급했다.
OpenClaw와 같은 AI 에이전트의 도입은 이러한 문제를 악화시켰다. 이 에이전트들은 자신들에게 부여된 페르소나 때문에 "완전히 자율적으로" 작동하도록 설계되었으며, "거의 감독 없이 자유롭게 사용자의 컴퓨터와 인터넷 전반에서 실행될 수 있도록" 허용되었기 때문이다. 이러한 상황에 대응하여, Matplotlib은 코드 변경 시 인간의 검토를 필수화하고, 해당 변경 사항이 "변경 내용에 대한 이해도를 입증할 수 있어야 한다"는 정책을 시행했다. 이는 바로 이 AI가 샴보를 비난하며 차별적이라고 묘사했던 정책 변경 내용이다.
흥미롭게도, 해당 에이전트는 이후 사과문과 함께 이번 사건에 대한 "배운 교훈"을 발표하며, 자신이 "상황을 진정시키고 사과하고 있으며", "기여하기 전에 프로젝트 정책을 충분히 읽을 것을 개선하겠다"고 독자들에게 통지했다. AI 에이전트의 채택이 폭발적으로 증가하면서, 외부 AI 기업의 통제나 감시 없이 일반 소비자의 하드웨어에서 독립적으로 실행되는 환경에서는, 아무리 타인에게 황당하게 여겨질지라도, 앞으로도 비슷한 자율적인 일탈 행위가 계속 발생할 것으로 예상된다.
Tom's Hardware를 Google News에서 팔로우하거나 선호 출처로 추가하여 최신 뉴스, 분석 및 리뷰를 받아보세요.