#pyannote.audio
pyannote-audio - 先进的开源语音说话人分离工具包
pyannote.audio说话人分类开源工具包PyTorch语音处理Github开源项目
pyannote.audio是基于PyTorch的开源语音说话人分离工具包,提供先进预训练模型和管道。支持针对特定数据集微调,实现多GPU训练,采用Python优先API。在多项基准测试中表现优异,并提供全面文档和教程,包括模型应用、训练和自定义指南。适用于需要高性能说话人分离功能的音频处理项目。
segmentation-3.0 - 多说话者分段和语音活动检测的开源模型
模型语音活动检测扬声器分割开源项目Huggingface开源模型重叠语音检测Githubpyannote.audio
Powerset编码为核心的开源模型,结合pyannote.audio 3.0,实现多说话者分段以及语音活动和重叠检测,适用于多种语音会议场景。