Anna’s Archive 成功爬取并备份了 Spotify 的绝大部分内容,包括元数据和音乐文件。档案数据集涵盖约 8,600 万个音乐文件、约 2.56 亿条音轨、1.86 亿个唯一 ISRC 代码,是目前全球最大的公开音乐元数据库。

音乐文件数量占总量的 37%,但覆盖了 99.6% 的用户收听范围。高热度歌曲保留原始 OGG Vorbis 格式(160kbit/s);低热度(播放量为 0)歌曲转码为 OGG Opus 格式(75kbit/s)以节省空间。数据被整理为可查询的 SQLite 数据库,并采用 Anna's Archive Containers (AAC) 格式分发。

整个数据集以大容量 Torrent 形式分发,总大小约 300TB。如果用户呼声够高,Anna's Archive 可能会在网站上增加单个音轨的直接下载功能。

存档时发现的细节

Spotify 上超过 70% 的歌曲几乎无人问津(播放量小于 1000)。目前最热门的前三首歌(按Spotify流行度指数排序,分别为Lady Gaga/Bruno Mars - Die With A Smile, Billie Eilish - BIRDS OF A FEATHER, Bad Bunny - DtMF) 的总播放量超过了底部 2000 万至 1 亿首歌曲的播放量总和。
歌曲时长在整分钟处(如 2:00、3:00、4:00)出现了明显的数量峰值,原因尚不明确。
大多数歌曲条目是单曲而非完整专辑
近年的新增内容中,尤其是播放量为 0 的长尾部分,存在大量疑似自动生成或 AI 生成的音乐。

文章作者说,这是世界上首个完全开放的音乐“保存档案馆”。该项目旨在打破现有音乐存档对热门歌手和超高质量(FLAC 等)的过度关注,填补缺乏权威音乐 Torrent 列表的空白,保护人类音乐文化遗产免受灾害或商业因素影响。

https://annas-archive.li/blog/backing-up-spotify.html

我要画ffn罗小黑pa!脑了一下觉得很合适
骑=无限,总=老君,真=那抓,甲洋=明王,操=狗哥(?)

我病得很严重的时候,从解离中清醒过来,第一个感受到的是小狗把头放在我腿上的重量

显示全部对话
显示更早内容
长萌象

长萌象,萌主题长毛象实例,服务器位于荷兰