audioFlux简介
audioFlux是一个用C和Python实现的音频分析库,提供了系统性、全面性和多维度的音频特征提取功能。它支持数十种时频分析变换方法以及数百种相应的时域和频域特征组合,可以为深度学习网络提供训练数据,用于研究音频分类、分离、音乐信息检索(MIR)和ASR等音频领域的各种任务。
主要功能
audioFlux主要包含以下三个模块:
-
变换(Transform)模块:提供多种时频表示方法,如BFT、NSGT、CWT、PWT等。支持线性、Mel、Bark、ERB等多种频率尺度。
-
特征(Feature)模块:包含谱特征、倒谱系数、解卷积、色度等算法。
-
音乐信息检索(MIR)模块:包含音高估计、起音检测、谐波-打击乐分离等算法。
安装方法
audioFlux支持多种安装方式:
Python包安装
要求Python版本>=3.6,可以通过pip安装:
pip install audioflux
或者通过Anaconda安装:
conda install -c tanky25 -c conda-forge audioflux
其他安装方式
- iOS构建
- Android构建
- 从源码构建
详细安装说明请参考官方文档。
快速入门
audioFlux提供了丰富的示例代码,帮助用户快速上手:
更多示例请参考官方文档。
性能对比
audioFlux在性能上表现优异。以下是在AMD Ryzen Threadripper 3970X 32核处理器上的性能测试结果:
更多详细的性能测试结果请参考Benchmark模块。
文档资源
总结
audioFlux作为一个功能强大、性能优异的音频分析库,为音频处理和音乐信息检索研究提供了便利的工具。无论是初学者还是专业研究人员,都可以通过本文提供的学习资料快速上手audioFlux,充分发挥其在音频分析领域的潜力。