yt-whisper 项目介绍
yt-whisper 是一个开源项目,借助 yt-dlp
和 OpenAI 的 Whisper 技术,旨在为任何 YouTube 视频生成字幕文件。它适用于各种语言视频,并为用户提供了多种模型选择,帮助提升字幕生成的准确性。
安装指南
要开始使用 yt-whisper,用户需要具备 Python 3.7 或更新版本。可以通过以下命令来安装 yt-whisper:
pip install git+https://github.com/m1guelpf/yt-whisper.git
此外,还需安装 ffmpeg
,该工具可从大多数软件包管理器中获取:
-
在 Ubuntu 或 Debian 系统上,可以通过以下命令安装:
sudo apt update && sudo apt install ffmpeg
-
在 MacOS 上,使用 Homebrew 安装:
brew install ffmpeg
-
在 Windows 系统中,使用 Chocolatey 安装:
choco install ffmpeg
使用方法
使用 yt-whisper 生成字幕文件非常简单。用户可以通过以下命令,从指定的 YouTube 视频中生成 VTT 格式的字幕文件:
yt_whisper "https://www.youtube.com/watch?v=dQw4w9WgXcQ"
默认情况下,该工具会选择 small
模型来转录英语视频。如果希望获得更好的结果,尤其是处理其他语言的视频时,用户可以选择更大的模型。可选的模型包括:tiny
、tiny.en
、base
、base.en
、small
、small.en
、medium
、medium.en
、large
。
例如,使用 medium
模型的命令为:
yt_whisper "https://www.youtube.com/watch?v=dQw4w9WgXcQ" --model medium
另外,用户可以通过添加 --task translate
参数,将字幕翻译成英文:
yt_whisper "https://www.youtube.com/watch?v=dQw4w9WgXcQ" --task translate
若需查看更多可用选项,可运行:
yt_whisper --help
许可协议
yt-whisper 项目是开源的,遵循 MIT 许可证。有关更多详细信息,用户可以查看 LICENSE 文件。该项目为开发者和用户提供了灵活自由的使用体验,促进技术的传播和交流。