decipher - 自动生成视频字幕

项目介绍：Decipher

什么是 Decipher？

Decipher 是一款利用人工智能技术为视频生成字幕的工具。通过自动将视频中的音频内容转化为文本，Decipher 可以帮助您快速为视频添加字幕。这不仅省去了手动转录的繁琐步骤，还能使您的视频对更多观众更加友好和可及。Decipher 使用一种名为 Whisper 的先进语音识别系统来完成此任务。

Whisper 是什么？

Whisper 是一个由 OpenAI 开发的自动语音识别系统，采用了超过 680,000 小时的多语言和多任务监督数据进行训练。这些数据源自互联网的各个角落，因此 Whisper 在处理口音、背景噪音和技术语言时具有更高的鲁棒性和准确性。

如何开始使用 Decipher

根据个人使用偏好，用户可以通过两种方式开始使用 Decipher：

Google Colab
手动安装

使用 Google Colab

Google Colab 提供了一个基于云的机器学习和数据科学平台，用户无需拥有强大的 GPU 设备即可使用。用户可以在他们的服务器上免费申请使用强大的 GPU（如 Tesla K80、T4、P4 或 P100），每个会话最长可达 12 小时。对于需要更强劲的 GPU 和更长运行时间的用户，Colab Pro/Pro+ 选项是可行的选择。

在 Google Colab 上开始使用 Decipher 非常简单，只需要一个免费注册的谷歌账号，并且 Colab Notebook 本身已嵌入了使用指导。

手动安装

所需环境

需要安装 Python 和 ffmpeg

安装步骤

用户可以通过以下命令安装 Decipher：

pip install git+https://github.com/dsymbol/decipher

或者

git clone https://github.com/dsymbol/decipher
cd decipher && pip install .

注意：不要使用 pip install decipher，因为这会安装一个不同的包。

使用 GUI（gradio）

decipher gui
# 或者
python -m decipher gui

命令行使用

转录视频文件并生成 SRT 字幕文件： transcribe 子命令可用来将视频中的音频转录为 SubRip Subtitle (SRT) 文件，并可选择自动将生成的字幕嵌入到视频中。
使用现有 SRT 文件添加字幕： subtitle 子命令可以使用已经创建的 SRT 文件为视频添加字幕。此子命令不进行转录工作，通常用于验证由 transcribe 子命令生成的转录结果。

要马上开始使用，可以键入以下命令获取帮助信息：

decipher --help

如果以脚本方式运行无法成功，可以尝试作为包运行：

python -m decipher --help

命令行示例

为视频生成 SRT 格式的字幕：

decipher transcribe -i video.mp4 --model small

将生成的字幕嵌入到视频中：

decipher subtitle -i video.mp4 --subtitle_file video.srt --subtitle_action burn

不验证转录，直接生成并嵌入字幕：

decipher transcribe -i video.mp4 --model small --subtitle_action burn

通过这些功能，Decipher 为用户提供了一种简便而高效的方式来增强视频内容的可访问性，使更多观众能够轻松理解和欣赏视频内容。