#pyannote.audio

pyannote-audio - 先进的开源语音说话人分离工具包

pyannote.audio说话人分类开源工具包PyTorch语音处理Github开源项目

pyannote.audio是基于PyTorch的开源语音说话人分离工具包，提供先进预训练模型和管道。支持针对特定数据集微调，实现多GPU训练，采用Python优先API。在多项基准测试中表现优异，并提供全面文档和教程，包括模型应用、训练和自定义指南。适用于需要高性能说话人分离功能的音频处理项目。

segmentation-3.0 - 多说话者分段和语音活动检测的开源模型

模型语音活动检测扬声器分割开源项目Huggingface开源模型重叠语音检测Githubpyannote.audio

Powerset编码为核心的开源模型，结合pyannote.audio 3.0，实现多说话者分段以及语音活动和重叠检测，适用于多种语音会议场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号