热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LibriTTS
FunCodec学习资料汇总 - 开源神经语音编解码工具包
1 个月前
FunCodec是一个用于音频量化和下游应用的开源神经语音编解码工具包,本文汇总了该项目的各类学习资源,包括官方文档、预训练模型、教程等,帮助读者快速入门和深入学习FunCodec。
FunCodec
语音编解码
神经网络
开源工具
LibriTTS
Github
开源项目
1 个月前
FunCodec: 开源神经语音编解码工具包的全面介绍
2 个月前
FunCodec是一个用于音频量化和下游应用的开源工具包,支持文本到语音合成、音乐生成等任务。本文全面介绍了FunCodec的功能特性、模型架构、使用方法以及最新研究进展。
FunCodec
语音编解码
神经网络
开源工具
LibriTTS
Github
开源项目
2 个月前
USLM: 统一语音语言模型的创新与应用
2 个月前
USLM (Unified Speech Language Model) 是一个创新的统一语音语言模型,通过结合自回归和非自回归模型,实现了对语音信息的分层建模,为语音识别、合成等任务带来了新的可能。本文将深入介绍USLM的架构、特点及其在零样本文本转语音等方面的应用。
USLM
语音语言模型
SpeechTokenizer
零样本TTS
LibriTTS
Github
开源项目
2 个月前
相关项目
FunCodec
FunCodec是一个高效的开源神经语音编解码工具,提供高质量的文本到语音转换功能,并支持丰富的预训练模型。它易于安装,适用于多种数据集,持续集成最新技术,适合专业开发者和研究人员使用。
查看
USLM
USLM是基于SpeechTokenizer构建的统一语音语言模型,结合自回归和非自回归模型实现语音信息的分层建模。该开源项目提供完整的安装指南、预训练模型和零样本文本转语音推理流程。USLM在LibriTTS数据集上训练,展示了语音内容和副语言信息建模的能力,为语音处理研究提供新思路。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号