DiffSinger简介
DiffSinger是一个基于浅层扩散机制的歌声合成(SVS)和文本转语音(TTS)模型,由浙江大学等机构的研究人员提出。该项目的主要特点包括:
- 采用浅层扩散机制,能生成高质量和富有表现力的歌声/语音
- 支持歌声合成(SVS)和文本转语音(TTS)两种任务
- 开源了模型代码和预训练模型,方便研究人员和开发者使用
项目资源
代码仓库
论文
在线Demo
快速上手
- 环境配置
conda create -n diffsinger python=3.8
conda activate diffsinger
pip install -r requirements.txt
- 运行DiffSpeech(TTS版本)
参考TTS使用文档
- 运行DiffSinger(SVS版本)
参考SVS使用文档
相关数据集
延伸阅读
总结
DiffSinger作为一个开源的歌声合成和语音合成模型,为相关研究和应用提供了良好的基础。希望本文汇总的资料能帮助读者快速了解和使用DiffSinger项目。如有任何问题,欢迎在GitHub仓库中提issue讨论。