
연방 판사 윌리엄 알숩(William Alsup)은 Anthropic이 저작자들의 허락 없이 출판된 책을 활용하여 AI 모델을 훈련시키는 행위가 합법이라고 판결했습니다. 이는 법원이 저작권이 있는 자료를 대규모 언어 모델(LLMs) 훈련에 사용하는 경우, 공정 사용 원칙(fair use doctrine)이 AI 기업의 책임을 면제할 수 있다는 주장에 힘을 실어준 최초의 판례가 되었습니다.
이번 결정은 OpenAI, Meta, Google 등 수많은 소송을 제기해 온 저자, 예술가, 출판사들에게 큰 타격을 입혔습니다. 비록 이번 판결이 향후 다른 법원의 판결에 대한 확정적인 선례를 제공한다고 보기는 어렵지만, 법원이 창작자들보다 기술 기업들의 편에 설 수 있는 법적 토대를 마련했다는 평가가 나옵니다.
이러한 소송들은 종종 판사가 해석하는 재량권이 큰 저작권법의 예외 조항인 공정 사용 원칙에 의존합니다. 이 조항은 인터넷 시대는커녕 생성형 AI 훈련 데이터셋의 개념조차 없던 1976년 이후로 업데이트되지 않아 매우 까다롭다는 지적을 받아왔습니다.
공정 사용 판결은 다음 세 가지 요소 등을 종합적으로 고려합니다. 첫째, 자료의 사용 목적(예: 풍자나 교육 등은 활용 가능). 둘째, 상업적 이득을 위한 복제 여부(예: '스타워즈' 팬픽션을 쓰는 것은 가능하지만 판매할 수는 없음). 셋째, 파생 저작물이 원본과 얼마나 변형되었는지(변형성, transformative).
[회사 이름]과 같은 기업들 역시 저작권이 있는 자료를 이용한 훈련에 대해 공정 사용 주장을 펼쳐왔습니다. 그러나 이번 판결이 있기 전까지는 법원이 어떤 방향으로 판단할지 불분명한 상황이었습니다.
특히 이번 <Bartz 대 Anthropic>(Bartz v. Anthropic) 사건에서, 원고 저자들의 그룹은 Anthropic이 저작물을 취득하고 저장한 방식 자체에도 문제를 제기했습니다. 소송에 따르면, Anthropic은 '세상의 모든 책'을 담은 '중앙 라이브러리'를 영구적으로 구축하려 했으나, 이 저작권이 있는 수백만 권의 책들이 해적 사이트에서 무료로 다운로드된 것은 명백한 불법 행위였습니다.
판사가 Anthropic의 자료 훈련 과정 자체는 공정 사용에 해당한다고 인정한 것과 별개로, 법원은 이 '중앙 라이브러리'의 법적 성격에 대해서는 별도의 재판을 열 예정입니다.
알숩 판사는 판결문에서 "Anthropic의 중앙 라이브러리를 구축하는 데 사용된 불법 복제본과 이로 인한 손해에 대해서는 재판을 진행할 것입니다. Anthropic이 이전에 인터넷에서 훔친 책을 나중에 합법적으로 구매한 것이 도난에 대한 책임을 완전히 면제해 주지는 못하겠지만, 법정 손해배상액의 범위에는 영향을 미칠 수 있습니다."라고 덧붙였습니다.