热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#NVIDIA GeForce RTX 3060
speech-to-text - 实时音频转录系统,兼容多种格式,具备高级配置
Github
开源项目
Python
faster-whisper
实时转录
Silero VAD
NVIDIA GeForce RTX 3060
该开源项目使用Silero VAD技术检测静音部分,并结合Faster-Whisper将音频数据转录为文本。支持多种音频格式(如wav、mp3、ogg)和高级设置,如重复惩罚和无重复ngram大小。其HTML界面允许进行详细配置,并能同步显示转录结果,支持CUDA环境运行,兼容最新的Faster-Whisper版本(1.0.3),提升转录速度和准确性。
1
1
相关文章
实时语音转文字技术:基于Faster-Whisper的高效解决方案
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号