#HiFi-GAN

ParallelWaveGAN - 通过Pytorch实现多种高效声码器模型
ParallelWaveGANMelGANHiFi-GAN实时语音合成多扬声器模型Github开源项目
ParallelWaveGAN项目以非官方形式用Pytorch实现了多种声码器模型,如Parallel WaveGAN、MelGAN等,支持实时语音合成并兼容ESPnet-TTS、NVIDIA's Tacotron2等系统。可帮助用户搭建适应多种语言的声音合成器。
hifi-gan - 基于GAN技术的语音合成技术
HiFi-GAN语音合成生成对抗网络高保真效率Github开源项目
HiFi-GAN是一个开源项目,基于GAN技术,提供高保真且高效的语音合成解决方案。它不仅提供预训练模型,还能适应多种语音数据集,并支持灵活的配置选项。欢迎访问官方演示网站体验语音样本。
glow-tts - 通过单调对齐搜索进行文本转语音的生成流
Glow-TTS文本转语音并行合成HiFi-GAN模型训练Github开源项目
Glow-TTS,一款创新的文本到语音转换模型,独立完成文本与语音的单调对齐搜索,无需外部辅助。此模型不仅大幅提升合成速度,还支持多样性与可控性,并可适应多说话人环境。更新项包括采用新技术降低噪声并优化发音,使其在速度和音质上优于传统模型。
speecht5_hifigan - 用于语音合成和声音转换的开源声码器
模型声音转换Github开源项目Huggingface语音处理SpeechT5文本转语音HiFi-GAN
SpeechT5 HiFi-GAN是一个专为SpeechT5文本转语音和声音转换模型开发的开源声码器。该项目采用MIT许可证,提供预训练权重,能够与SpeechT5的语音处理功能无缝集成。它为开发者和研究人员在语音合成和声音转换领域提供了实用工具。SpeechT5采用统一模态的编码器-解码器预训练方法,为口语处理技术开辟了新的研究方向。