#HiFi-GAN

Glow-TTS学习资料汇总 - 基于单调对齐搜索的生成式文本转语音模型

3 个月前

Glow-TTS 文本转语音并行合成 HiFi-GAN 模型训练 Github 开源项目

3 个月前

ParallelWaveGAN学习资料汇总 - 快速高质量语音合成模型

3 个月前

ParallelWaveGAN MelGAN HiFi-GAN 实时语音合成多扬声器模型 Github 开源项目

3 个月前

HiFi-GAN入门学习资料汇总 - 高效高保真语音合成模型

3 个月前

HiFi-GAN 语音合成生成对抗网络高保真效率 Github 开源项目

3 个月前

Glow-TTS: 一种基于单调对齐搜索的生成式文本转语音模型

2024年08月30日

Glow-TTS 文本转语音并行合成 HiFi-GAN 模型训练 Github 开源项目

2024年08月30日

HiFi-GAN: 高效高保真语音合成的新突破

2024年08月30日

HiFi-GAN 语音合成生成对抗网络高保真效率 Github 开源项目

2024年08月30日

ParallelWaveGAN: 快速高效的神经声码器

2024年08月30日

ParallelWaveGAN MelGAN HiFi-GAN 实时语音合成多扬声器模型 Github 开源项目

2024年08月30日

相关项目

ParallelWaveGAN

ParallelWaveGAN项目以非官方形式用Pytorch实现了多种声码器模型，如Parallel WaveGAN、MelGAN等，支持实时语音合成并兼容ESPnet-TTS、NVIDIA's Tacotron2等系统。可帮助用户搭建适应多种语言的声音合成器。

hifi-gan

HiFi-GAN是一个开源项目，基于GAN技术，提供高保真且高效的语音合成解决方案。它不仅提供预训练模型，还能适应多种语音数据集，并支持灵活的配置选项。欢迎访问官方演示网站体验语音样本。

glow-tts

Glow-TTS，一款创新的文本到语音转换模型，独立完成文本与语音的单调对齐搜索，无需外部辅助。此模型不仅大幅提升合成速度，还支持多样性与可控性，并可适应多说话人环境。更新项包括采用新技术降低噪声并优化发音，使其在速度和音质上优于传统模型。

speecht5_hifigan

SpeechT5 HiFi-GAN是一个专为SpeechT5文本转语音和声音转换模型开发的开源声码器。该项目采用MIT许可证，提供预训练权重，能够与SpeechT5的语音处理功能无缝集成。它为开发者和研究人员在语音合成和声音转换领域提供了实用工具。SpeechT5采用统一模态的编码器-解码器预训练方法，为口语处理技术开辟了新的研究方向。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com