YouTube 音频转文本转录项目简介
项目描述
YouTube 音频转文本转录项目是一个高级且用户友好的自动化工具,专门用于下载 YouTube 视频中的音频,将其转录为文本,检测文本的语言,并将结果保存到文本文件中。该工具利用最新技术,简化了转录过程,节省了用户的时间、精力和资源,非常适合需要快速准确转录的用户,如研究人员、内容创作者或需要无障碍访问的用户。
主要功能
- 用户友好:该脚本的设计旨在简化用户操作,只需输入 YouTube 视频网址即可启动,避免复杂的设置流程。
- 高效音频提取:使用
pytube
库有效过滤并下载指定 YouTube 视频的音频流。 - 高质量转录:使用功能强大的
whisper
库,将下载的音频准确转录为文本。 - 便捷的输出:转录结果作为文本文件保存在与脚本相同的目录中,方便用户访问和共享。
先决条件
- Python 3.6 或更高版本
- 使用
pip
安装所需的库
所需库
pytube
:一个轻量级的 Python 库,使 YouTube 视频的下载和音频流的提取变得简单。whisper
:一款高级的语音转文本库,能高效准确地进行音频文件转录。langdetect
:一个移植自 Google 的语言检测库。
安装步骤
- 克隆此项目仓库或下载脚本。
- 安装所需的库:
pip install pytube
pip install git+https://github.com/openai/whisper.git
pip install langdetect
- 下载 FFmpeg 并将其添加到环境变量中。
- Windows: 参考相关网站
- Mac: 参考相关网站
- Ubuntu: 参考相关网站
使用方法
- 运行脚本:
python youtube_audio_to_text.py
- 脚本会提示输入需要转录的 YouTube 视频网址,例如:
Enter the YouTube video URL: https://www.youtube.com/watch?v=XXXXXXXXXXX
-
脚本将下载音频,进行转录,检测语言,并将结果保存到名为
output_{language}.txt
的文本文件中。 -
通过打开与脚本相同目录中的
output_{language}.txt
文件以访问转录内容。
工作流程
- 用户在提示时输入 YouTube 视频网址。
- 使用
pytube
库创建YouTube
对象并过滤音频流。 - 将音频流作为 MP3 文件下载并保存到
YoutubeAudios
文件夹中。 whisper
库加载基础模型,将下载的音频转录为文本。langdetect
库检测转录文本的语言。- 将转录内容保存到名为
output_{language}.txt
的文本文件中,其中语言码作为文件名的一部分并打开供用户查看。
参与贡献
我们非常欢迎并重视用户的贡献,主要通过拉取请求和问题报告来进行。
拉取请求
- 派生此仓库并从
main
分支创建一个分支。 - 对代码进行变更或添加。
- 提交更改并推送到分支。
- 向
main
分支发起拉取请求,并附上清晰简明的变更描述。
问题
- 导航到仓库的“问题”部分。
- 检查是否存在与您想创建的问题类似的问题。
- 如果没有现有问题,通过点击“New issue”按钮创建一个新问题。
- 提供详细描述,并附上您希望对当前脚本进行的潜在更改的信息。