메타, EU 공공 콘텐츠로 AI 모델 학습 착수

sw_reporter

메타는 월요일, 이전에 데이터 개인 정보 보호 우려로 인한 규제 압력에 따라 계획을 중단했던 것과는 달리, 페이스북과 인스타그램의 게시물 및 댓글과 같은 공개 콘텐츠를 활용하여 AI 모델을 훈련할 것이라고 발표했습니다. 회사에 따르면, 메타는 이번 주부터 EU 사용자 콘텐츠를 활용한 AI 훈련을 시작할 예정이며, 사용자들이 메타 AI와 상호작용한 기록 또한 모델 훈련에 사용될 것입니다.

이번 발표는 지난달 EU에서 메타 AI의 제한적 버전이 출시된 후에 나왔습니다. (이전 버전은 미국 및 다른 글로벌 시장에서 먼저 공개된 바 있습니다.)

메타는 수년 동안 미국에서 사용자 생성 콘텐츠를 이용해 AI를 훈련해 왔으나, EU의 엄격한 개인 정보 보호법, 특히 AI 모델 훈련을 위한 개인 데이터 처리 시 명확한 법적 근거를 요구하는 일반 데이터 보호 규정(GDPR) 때문에 어려움을 겪어왔습니다.

메타는 2024년 6월, 아일랜드 데이터 보호 위원회(DPC)의 반대에 따라 EU와 영국에서의 사용자 데이터 이용 AI 시스템 훈련 계획을 일시 중단한다고 밝힌 바 있습니다. DPC는 EU에서 메타를 규제하며, 해당 블록 전역의 여러 데이터 보호 기관을 대표하는 역할을 수행했습니다. 이후 2024년 9월에는 영국 사용자 기반의 공개 게시물을 이용해 AI 시스템 훈련을 재개한다고 발표했습니다.

그리고 오늘, 메타는 EU 사용자 기반의 공개 게시물을 이용한 훈련까지 진행하겠다고 발표했습니다.

메타는 자체 블로그 게시물을 통해 "작년에 당사는 규제 당국이 법적 요건을 명확히 할 때까지 공개 콘텐츠를 활용한 거대 언어 모델(LLM) 훈련을 지연시켰습니다"라고 언급하며, "지난 12월 유럽 데이터 보호 위원회(EDPB)가 당사의 원래 접근 방식이 법적 의무를 충족했음을 확인한 의견에 환영합니다. 그 이후로 우리는 IDPC와 건설적으로 협력해 왔으며, 유럽 사람들에게 생성형 AI의 모든 혜택을 계속 제공하기를 기대합니다"라고 덧붙였습니다.

금주부터 EU 사용자들은 메타가 모델 훈련에 공개 데이터 및 메타 AI와의 상호작용을 사용하게 된다는 설명과 함께 인앱 및 이메일 알림을 받게 됩니다. 이 알림에는 사용자가 자신의 데이터 사용을 거부(opt out)할 수 있는 양식 링크가 포함될 것입니다. 메타는 이미 접수된 모든 거부 의사 양식과 새로 제출되는 모든 양식을 존중할 것이라고 밝혔습니다.

한편, 메타는 모델 훈련에 민감 메시지나 EU 거주 18세 미만 사용자의 공개 데이터를 사용하지 않는다고 강조했습니다.

메타는 "저희는 유럽인들에게 단순히 이용 가능한 수준을 넘어, 실제로 유럽 공동체를 위해 구축되는 AI를 만들 책임이 있다고 믿습니다"라고 밝히며, "이것이 바로 생성형 AI 모델이 유럽 공동체가 지닌 놀랍고 다양한 뉘앙스와 복잡성을 이해하기 위해 다양한 데이터를 기반으로 훈련되는 것이 매우 중요한 이유입니다. 여기에는 방언 및 구어체는 물론, 초지역적인 지식, 그리고 각국이 제품에서 유머나 풍자를 사용하는 독특한 방식까지 포함됩니다"라고 설명했습니다.

메타는 이미 유럽 사용자 데이터를 활용해 AI 모델을 훈련한 구글(Google)이나 OpenAI 등 다른 기업의 선례를 따르고 있다고 전했습니다.

한편, DPC는 대규모 언어 모델 개발사들이 AI 서비스를 훈련시키는 방식에 대한 심층적인 감시를 완전히 멈추지는 않고 있습니다. 지난주에는 규제 기관이 xAI가 개발한 Grok의 훈련 방식에 대해 조사하고 있다고 발표하기도 했습니다.

[출처:] https://techcrunch.com/2025/04/14/meta-to-start-training-its-ai-models-on-public-content-in-the-eu