项目介绍:llm-python
llm-python 项目是一个专注于大型语言模型(LLM)开发与工具学习的成熟资源集合,其中包含了一系列教学材料、代码示例和 Python 脚本。该项目通过接口如 llamaindex、langchain、Chroma (Chromadb) 和 Pinecone 展示了 LLM(如 GPT 等)的应用。主要用作作者在 YouTube 上的 LangChain 教程视频的参考代码存储。
教程视频与自学资源
在 llm-python 项目中,用户可以通过观看约8小时的 YouTube 教程视频来学习 LangChain。这些视频教程涵盖了 LLM 开发中的关键概念与工具使用技巧,每个教程都配备了相应的代码实例,旨在帮助用户更好地理解和实操学习内容。用户可以根据自己的学习目标,自由选择开始的内容。
以下是教程视频内容概览:
部分 | 教程主题 | 链接 | 视频时长 |
---|---|---|---|
1 | OpenAI 教程与视频导览 | 教程视频 | 26:56 |
2 | LangChain + OpenAI 教程:构建自有文本数据的问答系统 | 教程视频 | 20:00 |
3 | LangChain + OpenAI 与自有数据库/CSV 聊天 | 教程视频 | 19:30 |
4 | LangChain + HuggingFace 推理 API(无需 OpenAI 额度) | 教程视频 | 24:36 |
5 | 理解 LLM 中的嵌入 | 教程视频 | 29:22 |
6 | 使用 LLamaIndex + GPT3 查询任何网站(配 Chromadb, Trafilatura) | 教程视频 | 11:11 |
7 | 本地托管的离线 LLM,使用 LlamaIndex + OPT(开源,指令调优 LLM) | 教程视频 | 32:27 |
8 | 构建 AI语言导师:Pinecone + LlamaIndex + GPT-3 + BeautifulSoup | 教程视频 | 51:08 |
9 | 构建可查询的日志系统 💬,使用 OpenAI、Markdown 和 LlamaIndex 🦙 | 教程视频 | 40:29 |
10 | 使用 Cohere LLM + Stability.ai 制作科幻游戏:生成式 AI 教程 | 教程视频 | 1:02:20 |
11 | GPT 从提示中构建整个派对邀请应用 | 教程视频 | 41:33 |
12 | 设计 LLM 提示语言:指导原则 | 教程视频 | 43:15 |
13 | 你应该使用 LangChain 的缓存机制! | 教程视频 | 25:37 |
14 | 使用 Steamlit + LangChain 构建聊天 AI 应用 | 教程视频 | 32:11 |
完整的教程视频可在 YouTube 播放列表中找到。
快速开始指南
- 克隆此仓库。
- 安装所需库:运行
pip install -r requirements.txt
。 - 项目提供了一些示例数据文件在
news
文件夹中,但用户可以通过替换或添加文本文件来使用自己的数据。 - 创建一个
.env
文件,其中包含从 OpenAI 获取的 OpenAI API 密钥。可选的HUGGINGFACEHUB_API_TOKEN
和PINECONE_API_KEY
用于某些教程。- 教程 10 涉及 Cohere 和 Stability AI,这些技术无需信用卡即可使用免费版本,可以在
.env
文件中添加相应的密钥COHERE_API_KEY
和STABILITY_API_KEY
。
- 教程 10 涉及 Cohere 和 Stability AI,这些技术无需信用卡即可使用免费版本,可以在
.env 文件样例如下:
OPENAI_API_KEY=your_api_key_here
# 非必须,适用于多数教程
HUGGINGFACEHUB_API_TOKEN=your_api_token_here
PINECONE_API_KEY=your_api_key_here
- 使用任意顺序运行示例代码,例如,运行
python 6_team.py
即可使用 GPT-3 进行关于某公司及其团队的问答。用户可以配合对应视频逐步学习每个示例。
依赖与更新
该项目更新至最新版本 LlamaIndex (0.6.31) 和 LangChain (0.0.209)。如遇到问题,可以通过在 Issue 中提出讨论或提交 PR 来帮助更新代码。
指导与支持
项目提供自主管理的免费指导项目 Supertype Fellowship,可选预约 1 对 1 会话,包括视频辅导和代码审核。
许可证
MIT © Supertype 2024
此介绍以通俗易懂的方式展示了 llm-python 项目的丰富内容及其相关工具和资源,旨在帮助新手及有经验的开发者顺利使用和学习大型语言模型的实践与应用。