#UnivNet

univnet - 具有多分辨率频谱图鉴别器的神经声码器

UnivNet神经合成器高保真波形生成音频样本GANGithub开源项目

UnivNet是一种利用多分辨率频谱鉴别器的神经声码器，旨在提供高保真波形生成。本项目包括一个非官方PyTorch实现，并可与原始研究的客观评分相匹敌。它在主观评测中胜过HiFi-GAN，推理速度也比HiFi-GAN快1.5倍。项目还提供预置的训练参数和预训练模型，支持高度自定义和不同的音频数据源。

voicesmith - 实现个性化语音合成的强大工具

VoiceSmith文本转语音多说话者模型DelightfulTTSUnivNetGithub开源项目

VoiceSmith是一个允许用户训练和应用单语者及多语者模型的平台。该项目基于改良的DelightfulTTS和UnivNet模型，能在个人数据集上进行微调，带来高度自然的语音输出。VoiceSmith还包括数据预处理工具，如自动文本规范化功能，适合在Windows或Linux系统上使用，推荐配置NVIDIA GPU以优化训练效率。

相关文章

Article Cover

UnivNet: 高保真波形生成的新型神经声码器

Article Cover

VoiceSmith: 革新语音合成技术的开源项目

Article Cover

UnivNet学习资料汇总 - 高保真波形生成的神经声码器

Article Cover

VoiceSmith入门指南 - 让语音合成变得简单易用的开源工具

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号