项目介绍:whisper-standalone-win
whisper-standalone-win 是一种便利工具,为那些不想在使用 OpenAI 的 Whisper 和 Faster-Whisper 执行时处理 Python 安装的用户提供了独立可执行文件。这些工具可以直接在命令行界面中使用,也可以在类似 Subtitle Edit、Tero Subtitler、FFAStrans 和 AviUtl 等程序中应用。
支持平台
- Faster-Whisper 可执行文件可以在 Windows 7、Linux v5.4、macOS v10.15 及以上版本上运行。
- Faster-Whisper-XXL 可执行文件可在 Windows 7、Linux v5.4 及以上版本上运行。
- Whisper 可执行文件支持 Windows 7 及以上版本。
项目功能
Whisper
Whisper 是原始的 OpenAI Whisper 实现,未对原始代码进行更改,其开发较为停滞,目前可能仅对某些测试有用。
Faster-Whisper
Faster-Whisper 经过优化和调整,尤其适合电影转录,并且更具便携性。该工具的特点包括:
- 在命令行界面的标题栏中显示进度条。
- 自动检测 GPU,并在存在 CUDA 的情况下优先使用 GPU 工作。
- 默认情况下在同一文件夹中寻找模型,自动下载或手动从 Systran 和 Purfview 获取。
- 各种实验性的设置和调整,提高速度和效率,如
beam_size=1
可以加快转录速度,内存使用也有所优化。
Faster-Whisper-XXL
这一版本包含所有 Faster-Whisper 的功能,并添加高级功能:
- 使用 MDX23 Kim_vocal_v2 声音提取模型进行音频预处理。
- 提供多种语音活动检测(VAD)方法。
- 支持说话人分离。
使用示例
以下是一些简单的使用示例:
- 转录指定视频文件:
whisper-faster.exe "D:\videofile.mkv" --language English --model medium --output_dir source
- 帮助命令示例:
whisper-faster.exe --help
注意事项
- 程序和库可以从 Releases 页面下载。请避免将程序复制到 Windows 系统文件夹中(若已执行,请以管理员身份运行)。
- 推荐使用 'medium' 或更大的模型以获得良好的转录效果。
- YouTube 视频和 GitHub 讨论页面提供了关于如何运行命令行程序和批量处理多个文件的指南。
通过这些实用的工具,用户能够以更简单的方式在不同平台上自由操作转录任务,无需过多的技术操作。同时,用户可以通过命令行对工具进行精细调整和优化,以满足特定的工作需求。