热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#whisper-timestamped
whisper-timestamped - 多语言语音识别工具,支持单词时间戳和置信度评分
whisper-timestamped
语音识别
OpenAI
时间戳
信心评分
Github
开源项目
whisper-timestamped 是一个增强型多语言语音识别工具,基于 OpenAI 的 Whisper 模型,通过动态时间规整(DTW)技术预测单词时间戳,并附带置信度评分。该扩展兼容所有 Whisper 版本,优化内存使用,适用于处理长音频文件。此外,还支持在运行 Whisper 模型前进行语音活动检测(VAD),有效降低训练数据中的误差。whisper-timestamped 可提高识别准确度,尤其适用于包含语音卡顿或填充词的情景。
1
1
相关文章
Whisper-timestamped: 提供精确单词级时间戳的多语言自动语音识别工具
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号