热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#梅尔频谱图
vocos-mel-24khz - 基于GAN的高效神经声码器Vocos
模型
梅尔频谱图
音频合成
开源项目
Huggingface
GAN
Vocos
Github
神经声码器
Vocos是一个开源的神经声码器项目,采用GAN训练方法,能够从声学特征快速合成高质量音频。它通过生成频谱系数并进行傅里叶逆变换重建音频,实现单次前向传播的高效生成。项目提供预训练模型和Python接口,支持梅尔频谱图重建和文件复合合成。Vocos结合了时域和傅里叶域声码器的优点,为音频合成领域提供了新的技术方案。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号