LAION发布了被称为最大的公开可用音乐数据集DISCO-12M
非营利AI组织LAION发布了DISCO-12M,这是一个旨在支持开放音频AI模型开发的新数据集,包含了1200万条链接到YouTube音乐曲目及其相关元数据。该组织仅提供公开可用的YouTube视频链接及其元数据,而不提供实际的音乐文件,并明确声明不负责链接内容。

LAION解释说,DISCO-12M是DISCO-10M的升级版。通过直接从YouTube Music而不是Spotify抓取数据,他们消除了手动将Spotify元数据与YouTube视频匹配时出现的错误。他们还通过分析国家榜单和流派播放列表,将数据集中的艺术家数量扩展到了250,516。LAION建议DISCO-12M数据集可以帮助研究人员推进多个领域,例如构建更好的音频AI模型、识别关键音乐特征、创建基于内容的音乐搜索和改进音乐推荐系统。
免责声明:除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,因客观原因或会存在不当使用的情况,如,部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系。