Anna’s Archive 成功爬取并备份了 Spotify 的绝大部分内容,包括元数据和音乐文件。档案数据集涵盖约 8,600 万个音乐文件、约 2.56 亿条音轨、1.86 亿个唯一 ISRC 代码,是目前全球最大的公开音乐元数据库。
音乐文件数量占总量的 37%,但覆盖了 99.6% 的用户收听范围。高热度歌曲保留原始 OGG Vorbis 格式(160kbit/s);低热度(播放量为 0)歌曲转码为 OGG Opus 格式(75kbit/s)以节省空间。数据被整理为可查询的 SQLite 数据库,并采用 Anna's Archive Containers (AAC) 格式分发。
整个数据集以大容量 Torrent 形式分发,总大小约 300TB。如果用户呼声够高,Anna's Archive 可能会在网站上增加单个音轨的直接下载功能。
存档时发现的细节
Spotify 上超过 70% 的歌曲几乎无人问津(播放量小于 1000)。目前最热门的前三首歌(按Spotify流行度指数排序,分别为Lady Gaga/Bruno Mars - Die With A Smile, Billie Eilish - BIRDS OF A FEATHER, Bad Bunny - DtMF) 的总播放量超过了底部 2000 万至 1 亿首歌曲的播放量总和。
歌曲时长在整分钟处(如 2:00、3:00、4:00)出现了明显的数量峰值,原因尚不明确。
大多数歌曲条目是单曲而非完整专辑
近年的新增内容中,尤其是播放量为 0 的长尾部分,存在大量疑似自动生成或 AI 生成的音乐。
文章作者说,这是世界上首个完全开放的音乐“保存档案馆”。该项目旨在打破现有音乐存档对热门歌手和超高质量(FLAC 等)的过度关注,填补缺乏权威音乐 Torrent 列表的空白,保护人类音乐文化遗产免受灾害或商业因素影响。
小动物爱好者,饿死,狒狒,玩各种单机,不定时发生爆炸或者自闭,比起人类,首先是一个同人女,所以有时会做没人性的事情
没有推文的账号的关注不会通过,在此致歉