热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#3D-Speaker
3D-Speaker: 多模态说话人验证、识别与分割的开源工具包
2 个月前
3D-Speaker是一个开源的单模态和多模态说话人验证、说话人识别和说话人分割工具包,提供了多种先进模型的训练和推理方法,以及大规模多模态语音数据集,为语音表示学习研究提供了强大支持。
说话人验证
开源工具包
3D-Speaker
预训练模型
ModelScope
Github
开源项目
2 个月前
相关项目
3D-Speaker
3D-Speaker是一个开源的单模态和多模态说话人验证、识别和分离工具包。它提供ERes2Net、CAM++等预训练模型,适用于多种说话人相关任务。该项目发布的大规模语音数据集3D-Speaker有助于语音表示解耦研究。3D-Speaker支持有监督和自监督训练,以及语言识别等多种实验设置,为研究人员提供全面的说话人技术解决方案。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号