Fish 音频预处理器
这个仓库包含一些用于音频处理的脚本。主要功能包括:
- 视频/音频转wav格式
- 音频人声分离
- 自动音频切片
- 音频响度匹配
- 音频数据统计(支持确定音频长度)
- 音频重采样
- 音频转写(.lab格式)
- 通过FunASR进行音频转写(使用
--model-type funasr
启用,详细用法可在代码中找到) - 通过WhisperX进行音频转写
([ ]表示未完成,[x]表示已完成)
此代码已在Ubuntu 22.04 / 20.04 + Python 3.10上测试。如果您在其他版本上遇到问题,欢迎反馈。
快速开始:
pip install -e .
fap --help