#音频模型
awesome-ml - 机器学习资源库 涵盖语言模型图像视频和音频AI
Github开源项目大语言模型机器学习图像模型视频模型音频模型
该项目是一个综合性机器学习资源集合,包括大型语言模型、图像生成、视频处理和音频AI等领域的开源模型、工具、库和研究资料。适合开发者、研究人员和AI爱好者探索AI技术和应用。项目持续更新,欢迎贡献,为了解和实践机器学习最新进展提供参考。
fadtk - 标准化Frechet音频距离计算工具
Github开源项目评估工具音频模型FAD音频嵌入音频距离
fadtk是一个计算Frechet音频距离(FAD)的标准化工具库。它支持多种音频嵌入模型,能高效计算音频嵌入和FAD∞分数。该工具提供预计算统计数据用于基线比较,可计算单曲FAD以识别异常。fadtk主要用于评估生成音乐质量,为音频研究提供了实用灵活的解决方案。