项目介绍:快速入门大语言模型指南 第二版
欢迎来到“快速入门大语言模型指南 - 第二版”的 GitHub 仓库。本仓库包含书中使用的代码片段和笔记本,展示了在使用 Transformer 模型和大语言模型(LLMs)中的各种应用和高级技术。
仓库结构
目录
notebooks
:包含书中每一章的 Jupyter 笔记本。data
:储存笔记本中使用的数据集。images
:储存笔记本中使用的图像和图表。
笔记本概览
以下是 notebooks
目录中的笔记本列表,它们按照书中的章节进行组织。
第一部分 - 大语言模型简介
-
第二章:使用大语言模型进行语义搜索
02_semantic_search.ipynb
:介绍如何使用 OpenAI 和开源模型进行语义搜索。
-
第三章:提示工程的第一步
03_prompt_engineering.ipynb
:提供指令对齐大语言模型有效提示工程的指南。
-
第四章:AI 生态系统:整合各部分
04_rag_retrieval.ipynb
:构建检索增强生成(RAG)管道。04_agent.ipynb
:使用大语言模型和其他工具构建一个 AI 代理。
第二部分 - 充分利用大语言模型
-
第五章:通过定制微调优化大语言模型
05_bert_app_review.ipynb
:微调 BERT 模型,用于应用程序评论分类。05_openai_app_review_fine_tuning.ipynb
:微调 OpenAI 模型,用于应用程序评论分类。
-
第六章:高级提示工程
06_adv_prompt_engineering.ipynb
:提示工程的高级技术,包括输出验证和语义少样本学习。
-
第七章:定制嵌入和模型架构
07_recommendation_engine.ipynb
:使用定制微调的大语言模型和嵌入构建推荐引擎。
第三部分 - 高级大语言模型使用
-
第九章:超越基础模型
09_constructing_a_vqa_system.ipynb
:逐步指导如何使用 GPT-2 和视觉 Transformer 构建视觉问答系统。09_using_our_vqa.ipynb
:使用之前笔记本中构建的视觉问答系统。09_flan_t5_rl.ipynb
:使用强化学习来改进 FLAN-T5 模型输出。
-
第十章:高级开源大语言模型微调
10_SAWYER_LLAMA_SFT.ipynb
:微调 Llama-3 模型以创建 SAWYER 机器人。10_SAWYER_Reward_Model.ipynb
:根据人类偏好训练 SAWYER 机器人的奖励模型。10_SAWYER_RLF.ipynb
:应用人类反馈强化学习(RLHF)来对齐 SAWYER 机器人。10_SAWYER_USE_SAWYER.ipynb
:使用 SAWYER 机器人。10_anime_category_classification_model_freezing.ipynb
:微调 BERT 模型用于动画类别分类,比较层冻结技术。10_latex_gpt2.ipynb
:微调 GPT-2 以生成 LaTeX 公式。10_optimizing_fine_tuning.ipynb
:优化 Transformer 模型微调的最佳实践。
-
第十一章:将大语言模型投入生产
11_distillation_example_1.ipynb
:探索 Transformer 模型的知识蒸馏技术。11_distillation_example_2.ipynb
:高级蒸馏方法和应用。11_llama_quantization.ipynb
:量化 Llama 模型以实现高效部署。
-
第十二章:评估大语言模型
12_llm_calibration.ipynb
:校准大语言模型输出的技术。12_llm_gen_eval.ipynb
:评估大语言模型生成能力的方法。12_cluster.ipynb
:用于分析大语言模型输出的聚类技术。- 探索笔记 - 这里有十几个探索笔记,我将只分享几个关键的:
如何使用
要使用此仓库:
- 将仓库克隆到本地机器:
git clone https://github.com/yourusername/quick-start-llms.git
- 导航到 notebooks 目录并打开你选择的 Jupyter 笔记本:
cd quick-start-llms
- 安装必要的库:
pip install -r requirements.txt
注意:某些笔记本可能需要特定的数据集,这些数据集可以在 data 目录中找到。
贡献说明
欢迎贡献!如果你有任何补充、纠正或增强建议,请随时提交拉取请求。
免责声明
此仓库仅供教育目的,旨在配合《快速入门大语言模型指南 - 第二版》一书使用。请参考书籍以获取笔记本中涵盖主题的深入解释和讨论。
进一步了解 Sinan 的更多内容:
- 订阅 Sinan 的新闻通讯 AI 办公时间 获取更多有关 AI/LLM 的内容!
- Sinan 有一个播客节目名为 Practically Intelligent,他会在节目中讨论 AI 的最新发展。
- 查看 O'Reilly 上 Sinan 的播放列表 快速入门数据、LLM 和 ChatGPT,获取关于他的精选作品清单!