
Perplexity의 CEO 아라빈드 스리니바스(Aravind Srinivas)는 TechCrunch의 Disrupt 2024 컨퍼런스에서 Devin Coldewey와 진행한 무대 인터뷰에서 Perplexity가 "표절(plagiarism)"을 어떻게 정의하는지 명확하게 밝히지는 않았다.
이는 매우 민감한 주제다. 뉴스 코퍼레이션(News Corp) 소속 다우존스(Dow Jones)와 뉴욕 포스트(New York Post)는 Perplexity가 "콘텐츠 도둑질 놀이(content kleptocracy)"라고 묘사하는 문제와 관련하여 Perplexity를 고소했다. 다른 다수의 뉴스 사이트들 역시 Perplexity가 자신들의 콘텐츠를 지나치게 복제하고 있다는 우려를 제기해 왔으며, 불과 이번 달에는 뉴욕 타임즈(The New York Times)가 이 스타트업에 사용 중단 통지서(cease and desist)를 발송하기도 했다.
스리니바스는 Perplexity가 "항상 출처를 인용하며" 어떠한 콘텐츠의 소유권도 주장하지 않는다고 단호하게 밝혔다.
그는 "웹상의 콘텐츠를 끌어와 사용자가 쉽게 소화할 수 있도록 요약하고, 이 모든 정보를 제공합니다. 이는 기자들이 직무를 수행하는 방식, 학자들이 과제를 수행하는 방식, 또는 학생들이 보고서를 작성하는 방식과 정확히 동일합니다"라고 설명했다.
한편, 다우존스 소송에 대응하는 Perplexity의 최근 블로그 게시물에서는 출판사들이 자신들의 기술이 "존재하지 않기를" 바라며, "공개적으로 보도된 사실은 기업이 소유해야 한다"고 선호할 것이라는 주장이 제기되었다. 그러나 이 게시물은 일부 출판사들이 주장하듯이, Perplexity가 대규모로 콘텐츠를 되풀이(regurgitates)하는지 여부, 그리고 그렇게 할 경우 동일한 독자층을 두고 출판사들과 경쟁하는 문제에 대해서는 답변하지 못했다.
이번 주에 발표된 AI 표절 검사기인 Copyleaks의 보고서에 따르면, Perplexity의 한 요약본은 포브스(Forbes) 기사의 48%를 패러프레이징했으며, 또 다른 요약본은 28%의 패러프레이징과 7%의 표절(Copyleaks의 정의 기준)을 포함한 것으로 나타났다.
스리니바스는 Perplexity가 출처를 인용하며, 비록 때로는 실수도 있지만, "모든 문장 끝에 각주나 해당 정보의 출처가 되는 페이지 번호가 있다"고 지적했다. 그는 "물론 완벽하게 정밀하지는 않지만, 가능한 한 최선을 다하고 있다"고 덧붙였다.
스리니바스는 인터뷰 도중 여러 차례 Perplexity가 타임(Time), 포춘(Fortune), 디어 슈피겔(Der Spiegel) 등 여러 미디어 회사들과 수익 분배 프로그램(revenue-share program)을 진행 중이라고 언급했다. 다우존스 역시 잠재적인 파트너였으나, 상황을 격화시키는 방향을 택했고 소송 관련 공개 발언으로 대중을 오도하고 있다고 비판했다.
스리니바스는 "다우존스는 우리가 답변하지 않았다고 주장했다. 하지만 그건 사실이 아니다. 우리는 그날 바로 답변했고 말이다. 우리 노력은 협력하고 교류하며 함께 일하는 것임을 사람들이 이해해주기를 바란다"고 반박했다.

또한, 스리니바스는 다우존스 소송이 암시하는 바와 같이 사람들이 유료로 게재된 기사(paywalled articles)를 요약하기 위해 Perplexity를 사용하는 것이 아니라고 주장했다. 대신 그는 대부분의 사용자가 금융 리서치 목적으로 이 플랫폼을 이용한다고 말했다.
그는 "사람들은 일상 뉴스를 소비하기 위해 Perplexity를 찾아오는 것이 아니다. 어떤 일이 벌어지고 있는지 이해하기 위해 온다. 예를 들어, 이 특정 뉴스가 나에게 어떤 영향을 미치는지, 뉴스 맥락에서 엔비디아(Nvidia) 주식을 더 매수해야 할지 같은 질문들이다. 이런 질문은 TechCrunch에 와서 할 수 있는 종류의 질문이 아니기에 Perplexity를 찾는 것이다"라고 강조했다.
Perplexity는 현재 80억 달러의 기업 가치로 약 5억 달러의 투자 유치 논의를 진행 중인 것으로 알려졌다. 스리니바스는 최근 이 플랫폼의 주간 검색 쿼리가 1억 건을 기록했으며, 온라인 쇼핑 도구, 스포츠 점수 추적기, 새로운 광고 기능 등 다양한 제품들을 빠르게 출시하고 있다고 밝혔다.
그렇다면 최종 목표는 무엇일까? 스리니바스는 아마도 "과학자들이 특정 사실에 대한 소유권을 주장할 수 있지만, 다른 사람들(아마도 출판사들)이 그 사실이 어디에, 어떻게 맥락화되어 나타날지 통제할 수 없는 세상"을 상상하며 질문했다.
스리니바스는 "우리의 믿음은 사실이 모든 사람에게 보편적으로 배포되어야 한다는 것이다"라고 강조했다.
2024년 10월 30일 – 2024년 10월 30일
스토리라인:
TechCrunch Disrupt 2024: 토니 파델, 메리 바라, 콜린 캐퍼닉, 그리고 새로운 스타트업 전장 우승자
TechCrunch Disrupt 2024가 수백 명의 연사, 수백 개의 스타트업 및 전시업체, 그리고 수천 명의 참석자들이 모이는 가운데 막을 올렸다...
[출처:] https://techcrunch.com/2024/10/30/perplexitys-ceo-punts-on-defining-plagiarism