parrots:强大易用的语音识别与合成工具包
parrots是一个开源的语音识别(ASR)和语音合成(TTS)工具包,支持中文、英文、日语等多种语言。它实现了语音识别和语音合成模型的一键调用,开箱即用,非常适合快速开发语音相关应用。
主要特性
- ASR:基于distilwhisper实现的语音识别模型,支持中英等多语言
- TTS:基于GPT-SoVITS训练的语音合成模型,支持中英日等多语言
- 简单易用:提供Python API和命令行接口,快速集成
- 多语言支持:覆盖中英日等主流语言
- 高性能:采用先进的深度学习模型,识别和合成效果优秀
快速上手
- 安装
pip install parrots
- 语音识别示例
from parrots import SpeechRecognition
m = SpeechRecognition()
r = m.recognize_speech_from_file('audio.wav')
print('识别结果:', r)
- 语音合成示例
from parrots import TextToSpeech
m = TextToSpeech(speaker_name="MaiMai")
m.predict(
text="你好,欢迎使用parrots。",
output_path="output.wav"
)
在线Demo
相关资源
参考文献
- EAT: Enhanced ASR-TTS for Self-supervised Speech Recognition
- GPT-SoVITS: Large-scale Speech Synthesis with Generative Pre-training
parrots为开发者提供了强大而易用的语音处理能力,欢迎尝试使用并提出宝贵意见!如果对您有帮助,请在GitHub上star支持一下!