#LJSpeech
DiffSinger - 通过浅层扩散机制进行歌唱语音合成
DiffSingerPyTorch声音合成DiffSpeechLJSpeechGithub开源项目
DiffSinger项目通过PyTorch实现高效的浅层扩散机制声音合成。该项目支持多样的模型训练配置,涵盖基础、辅助解码器及浅层版本,并提供实时控制音调、音量和语速的功能,以适应不同的声音合成需求。适用于LJSpeech等数据集,适合从事音频合成研究与开发的专业人士。
Tacotron-pytorch - 端到端文本至语音合成技术的高效实现
Tacotron-pytorch文本转语音pytorchLJSpeech训练Github开源项目
Tacotron-pytorch是基于Pytorch框架开发的端到端文本至语音合成模型。该项目支持通过清晰的指南轻松部署和训练,使用LJSpeech数据集,并附带完整的预处理代码和网络训练文件。用户可以根据需要自定义超参数,非常适合进行科研和技术开发。项目提供了将成熟度逐渐提升的语音示例,欢迎进行下载和反馈。
tts-hifigan-ljspeech - 单声道声码器工具用于将声谱图转换为波形
单说话人HiFIGANGithub开源项目语音合成声码器模型HuggingfaceLJSpeech
此项目提供基于LJSpeech数据集训练的HiFIGAN声码器,可将声谱图转换为波形,适用于语音合成过程中的应用。模型针对单一发声者设计,但在一定程度上支持多发声者。建议使用22050 Hz采样率的输入数据,并参考SpeechBrain教程快速上手。
相关文章