解读 📺️
AI生成的转录字幕是一种利用人工智能自动将视频中的音频转录为字幕的方式。这消除了手动转录的需求,并可以使您的视频对更广泛的受众更加易于访问。解读使用whisper来转录视频中的音频并创建字幕。
什么是whisper?
Whisper 是OpenAI的一个自动化的最先进的语音识别系统,它经过680,000小时从网络收集的多语言和多任务监督数据的训练。这种大型而多样化的数据集提高了对口音、背景噪音和技术语言的鲁棒性。
快速开始
根据您的偏好,有两种不同的方式开始使用解读:
Google Colab
注意:
- 需要一个(免费)Google账户
- 指南嵌入在Colab笔记本中
Google Colab是一个免费的云端平台,用于机器学习和数据科学,无需您自己拥有强大的GPU。它提供了一个选项,可以借用他们服务器上的强大GPU(Tesla K80、T4、P4或P100),每个会话最长12小时。对于需要更强大GPU和更长运行时间的用户,可以选择Colab Pro/Pro+选项。
手动
依赖项
安装
pip install git+https://github.com/dsymbol/decipher
或
git clone https://github.com/dsymbol/decipher
cd decipher && pip install .
注意:请勿使用 'pip install decipher'。它会安装一个不同的软件包。
GUI(gradio)使用方法
decipher gui
# 或
python -m decipher gui
命令行使用方法
transcribe
子命令允许您将视频文件转录为SubRip Subtitle(SRT)文件。
它还有一个选项,可以自动将生成的字幕添加到视频中。
subtitle
子命令允许您使用现有的SRT文件向视频添加字幕。
这个子命令不执行转录,而是假设SRT文件已经创建。
它通常用于验证由transcribe
子命令生成的转录的准确性。
立即开始:
decipher --help
如果以脚本方式运行不起作用,您可以作为包运行解读:
python -m decipher --help
命令行示例:
为视频生成SRT字幕:
decipher transcribe -i video.mp4 --model small
将生成的字幕嵌入到视频中:
decipher subtitle -i video.mp4 --subtitle_file video.srt --subtitle_action burn
在不验证转录的情况下生成并将字幕嵌入视频:
decipher transcribe -i video.mp4 --model small --subtitle_action burn