#声纹识别

PaddleSpeech入门学习资料汇总 - 开源语音AI工具包

2 个月前

PaddleSpeech 语音识别文本转语音声纹识别语音合成 Github 开源项目热门

2 个月前

ChatTTS音色评估与分类：打造自然对话体验的关键

3 个月前

ChatTTS 音色评分音色打标稳定性评估声纹识别 Github 开源项目

3 个月前

PaddleSpeech:百度飞桨开源的功能强大的语音处理工具包

3 个月前

PaddleSpeech 语音识别文本转语音声纹识别语音合成 Github 开源项目热门

3 个月前

相关项目

PaddleSpeech

PaddleSpeech是基于PaddlePaddle平台的开源语音处理工具集，覆盖自动语音识别、文本转语音合成、说话人确认及声音分类等多项功能，提供易于使用、高效和灵活的模型，支持各类语音相关任务。工具集包含全流程服务，支持流式识别与合成系统，为研究和工业应用提供强大支持。

ChatTTS_Speaker

ChatTTS_Speaker项目基于ChatTTS开发，专注于AI合成语音的稳定性评估和特征标记。项目利用ERes2NetV2模型对2600个音色进行评分，评估包括长句、多句和单句的稳定性，以及音色的性别、年龄和特征识别。提供音色下载功能和详细的评分参数解释，为AI语音合成研究和应用提供有价值的参考数据。

wav2vec2-large-nonverbalvocalization-classification

该模型利用Nonverbal Vocalization数据集，基于wav2vec2架构，进行非语言声带的分类。可识别诸如咬牙、咳嗽、打哈欠、哭泣等声音分类。Wav2vec2模型不仅提升了语音识别的准确性，还增强了在多语言及多声学场景中的应用。该模型支持简单的部署与系统集成，优化了语音交互的体验。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com