#MelGAN
ParallelWaveGAN - 通过Pytorch实现多种高效声码器模型
ParallelWaveGANMelGANHiFi-GAN实时语音合成多扬声器模型Github开源项目
ParallelWaveGAN项目以非官方形式用Pytorch实现了多种声码器模型,如Parallel WaveGAN、MelGAN等,支持实时语音合成并兼容ESPnet-TTS、NVIDIA's Tacotron2等系统。可帮助用户搭建适应多种语言的声音合成器。
melgan - PyTorch实现的语音合成技术
MelGANPyTorch人工智能语音合成预训练模型音频处理Github开源项目
MelGAN是一个在PyTorch上实现的声码器,用于转换NVIDIA tacotron2的输出成原始音频。项目提供了基于LJSpeech-1.1数据集的预训练模型,用户可通过PyTorch Hub访问和试听。适合音频合成领域的研究与开发。
FastSpeech2 - 快速且高质量的端到端文本转语音
FastSpeech 2文本转语音PyTorchNVIDIAMelGANGithub开源项目
FastSpeech 2,面向精准快速的文本到语音转换,基于PyTorch与Espnet技术,配备Nvidia与MelGAN工具,极致优化语音生成效果,适合各类开发者利用和研究。
相关文章