audio-dataset
LAION发起的Audio Dataset Project致力于收集和处理大规模音频-文本对数据集。项目团队由Mila和UCSD的研究人员及全球贡献者组成,专注于数据收集、标准化处理和webdataset格式存储。该项目为CLAP等模型训练提供数据支持,并设有完善的贡献指南和进度跟踪系统,欢迎更多贡献者参与。