#多说话者模型
deepvoice3_pytorch - 基于卷积网络的文本到语音合成技术
DeepVoice3文本转语音PyTorch多说话者模型预训练模型Github开源项目
DeepVoice3_pytorch是基于PyTorch的文本到语音深度学习平台,支持多语种和多数据集,包括英语、日语和韩语,适合多个说话者或单个说话者。项目提供预训练模型、音频样本、在线演示及详尽的训练指南,旨在简化用户的使用过程,并能灵活定制个性化的语音合成应用。
voicesmith - 实现个性化语音合成的强大工具
VoiceSmith文本转语音多说话者模型DelightfulTTSUnivNetGithub开源项目
VoiceSmith是一个允许用户训练和应用单语者及多语者模型的平台。该项目基于改良的DelightfulTTS和UnivNet模型,能在个人数据集上进行微调,带来高度自然的语音输出。VoiceSmith还包括数据预处理工具,如自动文本规范化功能,适合在Windows或Linux系统上使用,推荐配置NVIDIA GPU以优化训练效率。
相关文章