
엔사이클로피디아 브리태니카(Encyclopedia Britannica)와 메리엄-웹스터(Merriam-Webster)가 오픈AI를 상대로 소송을 제기했으며, 소장에는 오픈AI가 "막대한 저작권 침해"를 저질렀다고 주장되어 있습니다.
소장에 따르면, 브리태니카가 소유한 약 10만 건의 온라인 기사들이 허가 없이 스크래핑되어 OpenAI의 대규모 언어 모델(LLMs)을 학습하는 데 사용되었다고 출판사 측은 주장했습니다.
브리태니카는 또한 OpenAI가 자사 콘텐츠의 "전부 또는 부분적인 문장 그대로의 복제물"을 생성할 때, 그리고 AI 연구소가 기사를 ChatGPT의 RAG(검색 증강 생성, retrieval augmented generation) 워크플로에 활용할 때 저작권법을 위반했다고 비난합니다. (여기서 RAG는 LLM이 질의에 응답할 때 웹이나 다른 데이터베이스에서 최신 정보를 검색하여 가져오는 방식입니다.) 브리태니카는 아울러 OpenAI가 조작된 환각(hallucinations)을 생성하고 이를 출판사 측에 허위로 귀속시킬 때 상표법인 랜햄법(Lanham Act)을 위반한다고 주장합니다.
소장에는 "ChatGPT는 [브리태니카]와 같은 출판사의 콘텐츠를 대체하고 직접적으로 경쟁하는 답변을 사용자 질문에 생성함으로써 웹 출판사들의 수익을 고갈시키고 있다"는 내용이 명시되어 있습니다. 브리태니카는 또한 ChatGPT의 환각 현상이 "대중이 고품질의 신뢰할 수 있는 온라인 정보에 지속적으로 접근하는 것을 위태롭게 한다"고 주장합니다.
브리태니카는 저작권 문제와 관련하여 OpenAI를 상대로 법적 조치를 취하는 다른 다수의 출판사 및 작가들과 함께 연합했습니다. (Mashable, CNET, IGN, PC Mag 등을 소유한) 브리태니카를 포함한 이들은 미국 전역의 12개 이상의 신문사들과 시카고 트리뷴(Chicago Tribune), 덴버 포스트(Denver Post), 선 센티넬(Sun Sentinel), 토론토 스타(Toronto Star), 캐나다 방송 공사(Canadian Broadcasting Corporation) 등을 거론하며 OpenAI를 고소했습니다.
한편, Perplexity를 상대로 한 브리태니카의 유사 소송은 현재 계류 중입니다.
현재 LLM 학습을 위해 저작권이 있는 콘텐츠를 사용하는 것이 저작권 침해에 해당하는지에 대해 명확하게 법적 선례를 확립한 사례는 없습니다. 그러나 한 특정 사례에서 Anthropic은 연방 판사 윌리엄 알숩(William Alsup)을 상대로, 콘텐츠를 학습 데이터로 사용하는 것이 합법적일 만큼 '변형적 사용(transformative use)'임을 성공적으로 입증한 바 있습니다. 하지만 알숩 판사는 Anthropic이 책을 구매하는 방식 대신 수백만 권의 책을 불법으로 다운로드하여 사용함으로써 법을 위반했으며, 이는 피해 작가들에게 15억 달러 규모의 집단 소송 합의금을 받아야 하는 사안이라고 판시한 바 있습니다.
오픈AI는 TechCrunch의 문의 요청에 대해 보도 전까지 답변하지 않았습니다.
[출처:] https://techcrunch.com/2026/03/16/merriam-webster-openai-encyclopedia-brittanica-lawsuit