Rapid ASR
📖文档导航
📆待办事项及任务认领
🎨整体框架
flowchart LR
A([wav]) --RapidVad--> B([各个小段的音频]) --RapidASR--> C([识别的文本内容]) --RapidPunc--> D([最终识别内容])
📣更新日志
详情
- 2023-08-21 v2.0.4 更新:
- 添加whl包支持
- 更新文档
- 2023-02-25
- 添加C++版本推理,使用onnxruntime引擎,预/后处理代码来自:[FastASR](https://github.com/chenkui164/FastASR)
- 2023-02-14 v2.0.3 更新:
- 修复librosa读取wav文件错误
- 修复fbank与torch下fbank提取结果不一致bug
- 2023-02-11 v2.0.2 更新:
- 模型和推理代码解耦(`rapid_paraformer`和`resources`)
- 支持批量推理(通过`resources/config.yaml`中`batch_size`指定)
- 增加多种输入方式(`Union[str, np.ndarray, List[str]]`)
- 2023-02-10 v2.0.1 更新:
- 添加对输入音频为噪音或静音文件的推理结果捕捉。