• 크리에이티브 커먼즈, 오픈 AI 생태계를 위한 프레임워크 'CC signals' 공개

    저작물을 크리에이터가 저작권을 유지한 채 공유하도록 하는 라이선싱 운동을 주도해 온 크리에이티브 커먼즈(Creative Commons)는 현재 AI 시대를 대비하고 있습니다. 이 조직은 수요일, 새로운 프로젝트인 CC signals의 출범을 발표했습니다. 이 프로젝트를 통해 데이터셋 보유자들은 자신들의 콘텐츠가 AI 모델 학습 등에 의해 어떻게 사용될 수 있는지, 혹은 사용될 수 없는지를 상세하게 명시할 수 있게 됩니다.

    이 아이디어는 인터넷의 개방성이라는 가치와 AI 구동에 필요한 막대한 데이터 수요 사이의 균형을 맞추는 것을 목표로 합니다.

    크리에이티브 커먼즈가 블로그 게시물에서 설명했듯이, 지속적인 데이터 추출 활동은 인터넷의 개방성을 약화시킬 수 있습니다. 이로 인해 기업들은 데이터를 공유하기보다는 웹사이트를 폐쇄하거나 유료 장벽(paywalls)으로 보호하는 상황이 발생할 수 있습니다.

    반면, CC signals 프로젝트는 데이터 통제자(data controllers)와 AI 학습에 데이터를 사용하는 주체 사이에서 활용될 수 있는 데이터셋 공유를 위한 법적, 기술적 프레임워크를 제공하는 것을 목표로 합니다.

    회사들이 정책 및 서비스 약관을 수정하면서 이러한 도구에 대한 수요가 증가하고 있습니다. 기업들은 자사 데이터에 대한 AI 학습을 제한하거나, 사용자가 제공한 데이터를 AI 관련 목적으로 어느 정도 범위까지 활용할지 명확히 해야 하기 때문입니다.

    예를 들어, X는 초기에는 제3자가 공개 데이터로 모델을 학습하도록 허용하는 정책을 마련했으나, 이후 이를 번복했습니다. 레딧은 자동 웹 크롤러가 사이트에 접근할 수 있는지 알려주는 robots.txt 파일을 활용하여 봇이 AI 학습을 목적으로 데이터를 무단 크롤링하는 것을 제한하고 있습니다. 클라우드플레어(Cloudflare)는 AI 봇의 데이터 스크래핑에 비용을 부과하거나 봇의 접근을 교란하는 솔루션을 모색하고 있으며, 오픈 소스 개발자들 또한 '크롤링 금지' 지침을 무시하는 AI 크롤러의 리소스를 지연시키고 낭비하게 만드는 도구들을 개발해 왔습니다.

    CC signals 프로젝트는 이러한 방식과는 다른 해결책을 제시합니다. 이는 법적 강제성과 윤리적 무게를 동시에 갖춘 일련의 도구 세트입니다. 이는 오늘날 온라인상에서 수십억 개의 개방 라이선스 창작물을 커버하는 CC 라이선스와 유사한 기능을 수행합니다.

    크리에이티브 커먼즈 CEO인 안나 투마도티르(Anna Tumadóttir)는 발표에서 "CC signals는 AI 시대에 공공 공유 자원(commons)을 지속시키기 위해 설계되었습니다. CC 라이선스가 개방 웹 구축에 기여했듯이, 저희는 CC signals가 상호 호혜성(reciprocity)에 기반한 개방형 AI 생태계를 형성하는 데 도움을 줄 것이라 믿습니다"라고 밝혔습니다.

    본 프로젝트는 이제 막 구체화 단계에 들어섰습니다. 초기 디자인은 CC 웹사이트와 GitHub 페이지에 게시되었습니다. 이 조직은 2025년 11월 예정된 알파 출시(초기 테스트)에 앞서 공청회를 통해 대중의 피드백을 적극적으로 수렴하고 있으며, 이를 위한 일련의 타운홀 미팅도 개최할 예정입니다.

    [출처:] https://techcrunch.com/2025/06/25/creative-commons-debuts-cc-signals-a-framework-for-an-open-ai-ecosystem