#Speaker Diarization
awesome-diarization - 说话者分离和语音分割的数据集
Speaker DiarizationFunASRSpeechBrainMiniVoxSIDEKITGithub开源项目
提供全面的说话者分离资源,包括最新的论文、软件工具、数据集和学习材料,旨在推进语音分割和说话者识别技术的发展。这些资源汇集了深度学习的最新进展及其实际应用,帮助研究人员和开发者找到最有效的解决方案。
whisper-diarization - 基于OpenAI Whisper的音频转录和说话人分离工具
Speaker DiarizationOpenAI Whisper语音识别说话人分类音频处理Github开源项目
whisper-diarization项目整合了OpenAI Whisper的语音识别技术和先进的说话人分离方法。该工具首先进行人声提取,然后利用Whisper生成转录文本,并通过WhisperX优化时间戳。结合MarbleNet和TitaNet等技术,它能够准确识别多个说话人,最终输出包含说话人标识的精确转录结果。这一开源解决方案特别适合需要处理多人对话音频的场景,为音频转录和分析提供了强大支持。
相关文章