#Speaker Diarization

awesome-diarization - 说话者分离和语音分割的数据集

Speaker DiarizationFunASRSpeechBrainMiniVoxSIDEKITGithub开源项目

提供全面的说话者分离资源，包括最新的论文、软件工具、数据集和学习材料，旨在推进语音分割和说话者识别技术的发展。这些资源汇集了深度学习的最新进展及其实际应用，帮助研究人员和开发者找到最有效的解决方案。

whisper-diarization - 基于OpenAI Whisper的音频转录和说话人分离工具

Speaker DiarizationOpenAI Whisper语音识别说话人分类音频处理Github开源项目

whisper-diarization项目整合了OpenAI Whisper的语音识别技术和先进的说话人分离方法。该工具首先进行人声提取，然后利用Whisper生成转录文本，并通过WhisperX优化时间戳。结合MarbleNet和TitaNet等技术，它能够准确识别多个说话人，最终输出包含说话人标识的精确转录结果。这一开源解决方案特别适合需要处理多人对话音频的场景，为音频转录和分析提供了强大支持。

相关文章

Article Cover

探索语音分割的奥秘:Awesome-Diarization项目全面解析

Article Cover

Whisper-Diarization: 基于OpenAI Whisper的自动语音识别与说话人分类技术

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号