Anthropic은 지난주 자체 웹사이트에서 2023년 바이든 행정부와 함께 마련했던, 안전하고 "신뢰할 수 있는" AI를 증진하기 위한 일련의 자발적 약속들을 조용히 삭제했습니다.
AI 위험 관리, AI 편향 및 차별 관련 정보 공유 및 연구를 포함했던 이 약속들은 AI 감시 그룹인 The Midas Project에 따르면 Anthropic의 투명성 허브(transparency hub)에서 삭제된 내용입니다. 다만, AI 생성 이미지 기반 성 착취 방지 등 바이든 행정부가 제시했던 다른 약속들은 여전히 남아 있습니다.
Anthropic은 이러한 변경에 대해 어떠한 통보도 하지 않은 것으로 보이며, 논평 요청에 대해서도 즉각적인 답변을 하지 않았습니다.
한편, Anthropic은 OpenAI, Google, Microsoft, Meta, Inflection 등과 함께 2023년 7월, 바이든 행정부가 제안한 특정 자발적 AI 안전 약속을 준수하기로 합의했다고 발표한 바 있습니다. 이 약속에는 AI 시스템 배포 전 내부 및 외부 보안 테스트 실시, 민감한 AI 데이터를 보호하기 위한 사이버 보안 투자, AI 생성 콘텐츠 워터마킹(watermarking) 방법 개발 등이 포함되었습니다.
명확히 하자면, Anthropic은 이 약속 내용에 담긴 여러 관행들을 이미 자체적으로 채택해 왔으며, 이 합의 자체는 법적 구속력이 없었습니다. 하지만 당시 바이든 행정부의 목적은 몇 달 뒤 발효될 보다 포괄적인 AI 행정 명령(AI Executive Order)에 앞서 자체적인 AI 정책 우선순위를 천명하는 것이었습니다.
반면 트럼프 행정부는 AI 거버넌스 접근 방식이 상당히 다를 것임을 시사해 왔습니다.
지난 1월, 트럼프 대통령은 앞서 언급된 AI 행정 명령을 폐지했습니다. 해당 명령은 국립표준기술원(National Institute of Standards and Technology)에 기업들이 모델의 결함, 특히 편향성(biases)을 식별하고 수정하는 데 도움을 줄 지침을 작성하도록 지시한 것이었습니다. 트럼프 행정부 지지 측 비평가들은 이 명령에 따른 보고 의무가 지나치게 과도하여, 실질적으로 기업들이 영업 비밀까지 공개하도록 강요한다고 주장했습니다.
AI 행정 명령을 철회한 직후, 트럼프 대통령은 연방 기관들에게 "인간의 번영, 경제 경쟁력, 국가 안보를 증진하는, 이념적 편향이 없는" AI 개발을 촉진하도록 지시하는 명령에 서명했습니다. 주목할 점은, 트럼프 대통령의 명령에는 바이든 행정부 이니셔티브의 핵심 기반이었던 AI 차별 퇴치에 관한 언급이 전혀 없었다는 것입니다.
The Midas Project가 X(구 트위터)를 통해 여러 차례 지적했듯이, 바이든 시대의 약속 중 어느 것도 해당 약속이 시간 제한적이거나 현직 대통령의 정당 소속에 따라 달라진다는 내용을 암시하지 않았습니다. 지난 11월 선거 이후, 여러 AI 기업들은 자신들의 약속에 변화가 없음을 확인해 왔습니다.
Anthropic만 공공 정책을 수정한 것은 아닙니다. OpenAI는 이와 같은 조치를 취했습니다.
두 회사의 조치를 살펴볼 때, 두 회사 모두 기업의 가치를 강화하는 데 초점을 맞추고 있습니다.