안나스 아카이브의 다음 목표는 책에 이어 음악이다.

Spotify는 12월 22일(ET) 오후 4시 31분에 다음과 같은 성명을 발표했습니다. "Spotify는 무단 스크래핑(scraping)에 관여한 악의적인 사용자 계정을 식별하고 비활성화했습니다. 또한, 저희는 이러한 저작권 침해 공격 유형에 대응하기 위한 새로운 안전장치를 구현했으며, 의심스러운 행동에 대해 적극적으로 모니터링하고 있습니다. Spotify는 애초부터 아티스트 커뮤니티와 함께 하며 해적 행위에 맞서 왔으며, 창작자들을 보호하고 권리를 지키기 위해 업계 파트너들과도 적극적으로 협력하고 있습니다."
수억 명의 활성 사용자 및 방대한 음악 라이브러리를 보유한 세계 최대 음악 스트리밍 플랫폼인 Spotify가 Anna's Archive에 의해 해킹당한 것으로 알려졌습니다. 스스로를 아카이브스트(archivists)라고 칭하는 이 '그림자 라이브러리'는 플랫폼 전체에 가까운 데이터를 스크래핑하여 약 300TB 규모의 음악을 다운로드했으며, 이 음악은 현재 토렌트(torrent)를 통해 불법적으로 유포되고 있습니다.
Spotify 측은 다음과 같이 밝혔습니다. "무단 접근 조사 결과, 제3자가 공개 메타데이터를 스크래핑하고 불법적인 전술을 사용하여 DRM(디지털 저작권 관리)을 우회함으로써 플랫폼의 일부 오디오 파일에 접근한 것으로 확인되었습니다. 현재 이 사건에 대해 적극적으로 조사하고 있습니다."

한편, Spotify에서 스크래핑된 8,600만 개 파일과 관련하여, 익명의 주체들은 3억 2,200만 달러 규모의 법원 판결에 직면했습니다.
여기서 언급된 '일부'라는 단어가 중요한데, 유출된 컬렉션이 특히 약 8,600만 개의 파일로 구성되어 있으며, 이는 플랫폼 전체 이용 음악의 약 37%에 해당하는 규모이지만 청취량은 무려 99.9%를 차지하기 때문입니다. 이 파일들의 대부분은 Spotify의 오리지널 OGG Vorbis 160kbps 형식으로 보존되어 있지만, 노래의 인기도(popularity) 등급이 정확히 0인 경우 공간 절약을 위해 75kbps로 재인코딩된 것으로 파악됩니다.
그 결과, Spotify의 모든 청취량의 99.6%를 차지하는 2억 5,600만 개의 메타데이터 행이 SQL 데이터베이스로 컴파일되었습니다. 이 그룹은 전 세계 개별 녹음을 식별하는 고유 식별자인 ISRCs를 포함하여 18,600만 개의 ISRCs가 포함된 Spotify API의 거의 손실 없는 JSON 재구성을 완료했습니다. 이 데이터에는 모든 앨범 정보, 아티스트 정보, 커버 아트 등의 메타데이터가 포함되어 있습니다.
Anna's Archive가 이 유출 건에 대해 공개한 블로그 게시물은 놀라울 만큼 상세한 정보를 담고 있으며, Spotify가 전반적으로 음악을 어떻게 취급하는지 분석하는 다양한 차트를 포함하고 있습니다. 예를 들어, 플랫폼의 모든 노래 중 약 70%는 거의 주목을 받지 못하며, 역대 가장 인기 있는 트랙은 0.1%에 불과합니다. 대부분의 곡들은 앨범 수록곡이라기보다는 싱글 형태이며, 120 BPM이 가장 흔한 템포로 확인되었습니다.

Anna's Archive 자체가 언급한 이 대규모 해킹의 근본적인 목적은 '음악 보존'입니다. 이 그룹이 동의 없이 책을 오픈소스화하는 것으로 악명 높기 때문에, 이들 역시 유사한 논리를 적용하여 Spotify의 컬렉션이 인기 아티스트와 음질에 지나치게 편중되어 있다고 주장합니다. 그들이 요구하는 것은 "지금까지 제작된 모든 음악을 대표하는 권위 있는 토렌트 목록"의 구축입니다.
해당 토렌트들은 자체 호스팅되며, 파일들은 이 그룹이 수년간 사용해 온 커스텀 형식인 Anna’s Archive Containers (AAC)를 이용해 패키징되었습니다. 이미 메타데이터는 공개되었으며, 나머지 데이터는 인기도 순으로 분류된 대규모 청크(chunk)를 통해 순차적으로 배포될 예정입니다. 따라서 이 스크래핑 사건의 전면적인 여파는 시간이 지난 후에야 완전히 드러날 것으로 예상됩니다.
최신 뉴스와 분석, 리뷰를 피드에서 받아보려면 Tom's Hardware를 Google News에서 팔로우하거나, 선호하는 소스로 추가하십시오.