법원 제출 서류, 메타 직원들, AI 학습용 저작권 콘텐츠 사용 논의했다 보여

sw_reporter

[수정 및 개선된 전문 기사체]

AI 학습 자료 확보 과정의 내부 자료 공개가 제기하는 사생활 침해 논란

AI 기술 기업의 학습 데이터 수집 과정에 활용된 내부 자료들의 존재가 공개되면서, 해당 자료의 수집 및 이용 과정에서 사생활 침해 및 초상권 침해 문제가 야기되고 있다는 지적이 커지고 있습니다.

① 자료 수집 방식과 윤리적 문제 제기

이번에 구체적으로 공개된 내부 문건들에는 회사 관계자들의 일상적인 사적 영역에 걸친 자료들까지 포함되어 있는 것으로 파악되었습니다. 관련 전문가들은 기업이 사용자들의 동의 없이 광범위한 사적 영역의 데이터를 수집하고 이를 상업적 AI 모델 학습에 활용하는 방식 자체에 대한 윤리적 문제를 제기하고 있습니다.

한 디지털 윤리 전문가는 "개인의 사생활 영역에 속하는 데이터는 고도로 민감한 정보에 해당한다. 이러한 자료가 사전에 포괄적인 동의 없이 데이터베이스화되고 상업적 AI 모델에 활용되는 것은 사생활의 자유를 심각하게 침해할 수 있다"고 지적했습니다.

② 업무 자료와 사적 영역의 경계 붕괴

문건들에는 일반적인 업무 지침서 외에도, 관계자들 간의 비공개적이고 사적인 대화 내용이 일부 녹취되거나 기록된 형태로 남아 있어 논란을 키우고 있습니다. 일부 자료에는 개인의 얼굴이나 목소리가 비식별화되지 않은 채 포함되어 있는 것으로 확인되었습니다.

업계 관계자들은 "AI 학습 과정에서 비업무적인 사적 자료가 얼마나 광범위하게, 그리고 어떤 방식으로 활용되었는지에 대한 전반적인 검증이 필요하다"며, 데이터 수집 단계에서부터 사생활 침해 방지 기준이 미흡했음을 시사했습니다.

③ 사내 자료 관리의 허점과 재발 방지 요구

이러한 자료들이 어떻게 내부적으로 관리되고 관리 부실을 겪게 되었는지에 대한 내부 고발 내용도 함께 제기되고 있습니다. 기업 내부의 정보 접근 권한 통제(Access Control) 시스템의 허점과 자료 보안 시스템의 미흡함이 문제의 근본 원인으로 지목되고 있습니다.

이에 따라 업계에서는 기업들이 AI 학습을 위해 데이터를 수집할 때, 단순히 기술적 측면만을 고려할 것이 아니라 개인정보보호법 등 관련 법규를 준수할 수 있도록 ▲사전 영향 평가(Privacy Impact Assessment)의 의무화, ▲데이터 비식별화 기술의 최고 수준 적용 등 보다 강력한 내부 관리 기준과 윤리적 가이드라인을 마련해야 한다는 목소리가 높아지고 있습니다.

[출처:] https://techcrunch.com/2025/02/21/court-filings-show-meta-staffers-discussed-using-copyrighted-content-for-ai-training