yt-fts简介
yt-fts是一个功能强大的命令行工具,可以帮助用户全文搜索YouTube频道的字幕内容。它使用yt-dlp抓取YouTube频道的所有字幕,并将其加载到可以从命令行搜索的SQLite数据库中。用户可以根据特定的关键词或短语查询频道,并生成包含关键词的视频的时间戳YouTube链接。
除了全文搜索外,yt-fts还支持使用OpenAI embeddings API和chromadb进行语义搜索,为用户提供更多高级功能。
主要功能
- 全文搜索:在保存的频道中搜索特定字符串
- 语义搜索:使用OpenAI embeddings进行向量搜索
- 视频摘要:生成YouTube视频转录文本的摘要,并提供时间戳链接
- LLM/RAG聊天机器人:使用GPT-4模型进行交互式聊天会话
- 字幕下载:下载指定YouTube频道的字幕
安装方法
通过pip安装yt-fts:
pip install yt-fts
使用教程
1. 下载频道字幕
使用download
命令下载频道字幕:
yt-fts download --jobs 5 "https://www.youtube.com/@3blue1brown"
2. 列出保存的频道
使用list
命令查看已保存的频道:
yt-fts list
3. 全文搜索
使用search
命令进行全文搜索:
yt-fts search "[搜索关键词]" --channel "[频道名称或ID]"
4. 语义搜索
首先需要生成embeddings:
yt-fts embeddings --channel "3Blue1Brown"
然后使用vsearch
命令进行语义搜索:
yt-fts vsearch "[搜索关键词]" --channel "[频道名称或ID]"
5. 视频摘要
使用summarize
命令生成视频摘要:
yt-fts summarize "https://www.youtube.com/watch?v=9-Jl0dxWQs8"
6. LLM聊天机器人
使用llm
命令启动交互式聊天会话:
yt-fts llm --channel "3Blue1Brown" "How does back propagation work?"
进阶技巧
- 导出搜索结果:使用
--export
参数将搜索结果导出为CSV文件 - 删除频道:使用
delete
命令删除保存的频道 - 更新频道:使用
update
命令更新频道的全文搜索数据 - 导出频道字幕:使用
export
命令导出频道的所有字幕
yt-fts为YouTube内容创作者、研究人员和爱好者提供了一个强大的工具,帮助他们更有效地搜索和分析YouTube视频内容。通过本文的介绍,相信读者已经对yt-fts有了初步的了解。欢迎访问yt-fts GitHub页面获取更多详细信息和最新更新。
无论您是想深入研究特定主题的YouTube内容,还是需要快速找到视频中的关键信息,yt-fts都是一个值得尝试的强大工具。开始使用yt-fts,探索YouTube内容的海洋吧!