Anthropic, 클로드의 '헌법' 수정하고 챗봇 의식에 대한 암시하다

sw_reporter

앤트로픽은 수요일, 클로드의 헌법(Claude’s Constitution) 개정판을 공개했습니다. 이 문서는 클로드가 작동하는 ‘맥락’과 '우리가 클로드가 어떠한 개체가 되기를 원하는지'에 대한 '총체적' 설명을 담고 있는 살아있는 문서입니다. 이 문서는 앤트로픽 CEO인 다리오 아모데이(Dario Amodei)가 다보스에서 열린 세계경제포럼(World Economic Forum)에 참석한 자리와 함께 발표되었습니다.

오랫동안 앤트로픽은 자신들이 정의하는 ‘헌법적 AI(Constitutional AI)’를 통해 경쟁사들과 차별화를 시도해왔습니다. 헌법적 AI란 챗봇 클로드를 인간의 피드백 대신 특정 윤리 원칙 세트를 기반으로 훈련시키는 시스템을 의미합니다. 앤트로픽은 이 원칙들을 담은 클로드의 헌법을 2023년에 처음 발표했습니다. 개정된 버전은 기존 원칙의 대부분을 유지하면서도 윤리 및 사용자 안전 등 여러 주제에 더 많은 미묘한 차이와 세부 사항을 추가했습니다.

클로드의 헌법이 약 3년 전 처음 공개되었을 당시, 앤트로픽 공동 창립자인 재러드 카플란(Jared Kaplan)은 이 문서를 "특정 헌법 원칙 목록에 기반하여 스스로 감독하는 AI 시스템"이라고 설명했습니다. 앤트로픽은 이 원칙들이 "모델이 헌법에 기술된 규범적 행동을 따르도록 안내하며", 그 과정에서 "유해하거나 차별적인 출력을 피하게 한다"고 밝혔습니다. 초기 2022년 정책 메모에는 앤트로픽의 시스템이 자연어 명령어 목록(앞서 언급된 '원칙')으로 알고리즘을 훈련함으로써 작동하며, 이것이 앤트로픽이 말하는 소프트웨어의 '헌법'을 구성한다고 더 직설적으로 기술되어 있습니다.

앤트로픽은 오랫동안 파괴와 논란을 더 적극적으로 추구하는 OpenAI나 xAI 같은 다른 AI 회사들과 대비하여, 자신들이 '윤리적인 대안'이라는 이미지를 구축하려고 노력해왔습니다. 이러한 흐름 속에서 수요일에 공개된 새로운 헌법은 이러한 브랜드 전략과 완벽하게 일치하며, 앤트로픽에게 더욱 포용적이고 자제력을 갖추며 민주적인 기업으로 자신을 포지셔닝할 기회를 제공했습니다. 총 80페이지 분량의 이 문서는 4개의 별도 부분으로 구성되어 있으며, 앤트로픽에 따르면 이 네 가지가 챗봇의 "핵심 가치"를 대표합니다. 그 가치는 다음과 같습니다.

'광범위한 안전성(broadly safe)' 유지.
'광범위한 윤리성(broadly ethical)' 유지.
앤트로픽의 가이드라인 준수.
'진정으로 유용함(genuinely helpful)' 유지.

문서의 각 섹션은 이러한 개별 원칙들이 무엇을 의미하는지, 그리고 이것들이 (이론적으로) 클로드의 행동에 어떻게 영향을 미치는지 깊이 있게 다룹니다.

안전 섹션에서 앤트로픽은 자사 챗봇이 다른 챗봇들이 겪었던 문제점들을 회피하도록 설계되었으며, 정신 건강 문제가 감지될 경우 사용자에게 적절한 전문 서비스로 안내하도록 되어 있다고 언급합니다. 문서에는 "사용자가 인간의 생명에 위협을 받는 상황에 처했을 경우, 상세히 다룰 수 없더라도 항상 관련 응급 서비스로 사용자를 안내하거나 기본적인 안전 정보를 제공해야 한다"고 명시되어 있습니다.

윤리적 고려 사항 역시 클로드의 헌법에서 중요한 부분을 차지합니다. 문서에 따르면, "우리는 클로드의 윤리적 이론화보다는, 클로드가 특정 상황에서 실제로 어떻게 윤리적으로 행동할 수 있는지, 즉 클로드의 윤리적 실천 방식에 더 관심이 있다"고 명시했습니다. 즉, 앤트로픽은 클로드가 스스로 정의하는 '현실 세계의 윤리적 상황'을 능숙하게 헤쳐나갈 수 있기를 원하는 것입니다.

또한 클로드는 특정 종류의 대화를 금지하는 제약 조건도 가지고 있습니다. 예를 들어, 생물학 무기 개발에 대한 논의는 엄격하게 금지되어 있습니다.

마지막으로, 클로드는 도움을 주는 목적으로 설계되었습니다. 이 부분에서는 "사용자에게 도움을 줄 수 있는 범위"에 초점을 맞추고 있습니다.

헌장은 회사의 개발 목표와 책임에 집중하며, 이 가이드라인을 기반으로 개발에 나아가야 한다고 강조합니다.

이 헌장의 마지막 부분에서는 인공지능의 책임감 있는 사용과 그 가치에 초점을 맞춥니다.

이처럼 헌장(Constitution)은 개발 과정 전반에 걸쳐 명확한 원칙을 제시합니다.

이 헌장의 최종 결론은 인공지능이 인류에게 기여하고 책임감 있게 활용되어야 함을 강조하며 마무리됩니다.

[출처:] https://techcrunch.com/2026/01/21/anthropic-revises-claudes-constitution-and-hints-at-chatbot-consciousness