#HuBERT

bark-voice-cloning-HuBERT-quantizer - Python 3.10下的Bark高质量语音克隆，多语言支持

Barkvoice cloningHuBERTquantizerpythonGithub开源项目

该项目提供了一种在Python 3.10环境下，利用Bark进行高质量语音克隆的方法，并兼容多种语言的HuBERT模型和定制量化器模型。通过Huggingface模型页面、音频Web UI和在线交互式笔记本，用户可以获取代码实例和实现语音克隆。项目还包括语音输入要求和训练指南，帮助开发者实现语音克隆功能。

chinese_speech_pretrain - 中文语音预训练模型，wav2vec 2.0和HuBERT的开源实现

语音预训练模型中文语音识别wav2vec 2.0HuBERTWenetSpeechGithub开源项目

chinese_speech_pretrain项目开源了基于WenetSpeech数据集训练的中文语音预训练模型。项目包含wav2vec 2.0和HuBERT的BASE与LARGE版本，均使用1万小时多样化中文语音数据训练。模型在自动语音识别任务中表现优异，尤其适合低资源场景。项目提供模型下载及使用指南，可用于语音识别、语音合成等研究领域。

japanese-hubert-base - 日语HuBERT Base自监督语音学习模型

HuBERT开源项目模型Githubrinna/japanese-hubert-baseHuggingface日语语音模型ReazonSpeech自我监督学习

rinna Co., Ltd.发布的日语HuBERT Base模型，采用与原始HuBERT相同的12层变换器结构，通过ReazonSpeech语料库的19000小时语音数据进行训练，支持自监督语音表示学习。模型提供详尽的训练配置和论文参考，便于研究和应用。使用Transformers库可方便地实现日语语音处理。

hubert-base-superb-ks - 基于HuBERT的语音命令词识别与关键词检测模型

语音识别音频分类HuggingfaceSUPERB关键词检测开源项目模型HuBERTGithub

该语音关键词检测系统基于HuBERT预训练模型开发，可识别Speech Commands数据集中的10类预设命令词、静音和未知类别。模型在测试集达到96.72%准确率，支持16kHz采样率音频输入，集成transformers pipeline接口，便于设备端快速部署和调用。

相关文章

Article Cover

深入解析Bark与HuBERT:打造高质量AI语音克隆系统

Article Cover

中文语音预训练模型：推动中文语音识别技术的突破性进展

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号