Large-Language-Model-Notebooks-Course 项目介绍
项目概述
Large-Language-Model-Notebooks-Course 是一个关于大型语言模型(LLM)的实践性学习项目,旨在通过一系列小项目和应用实例,帮助学习者掌握使用大型语言模型的技巧和策略。该项目是一本书《大型语言模型:应用与实现策略》的非官方仓库,内容涵盖多种工具和技术的使用,并借助 OpenAI 和 Hugging Face 的模型提供实际操作体验。课程持续更新,不断引入新的样例和章节。
课程结构
课程分为三个主要部分:技术和库、项目以及企业解决方案。
技术和库
在技术和库这一部分,学习者将探索各种技术和库,通过小例子逐步构建更大的项目。主要覆盖的话题包括:
- 使用 OpenAI API
- 通过 Hugging Face 使用向量数据库
- LangChain、Fine Tuning
- 知识蒸馏等
具体项目示例有创建一个餐厅聊天机器人及自然语言转 SQL 翻译器。
项目
在项目部分,学习者将创建不同的项目并解释设计决策。这部分内容展示了如何形成多个实施方案,并深入讨论 LLMOps 相关话题,尽管它不是课程的核心。
例如,项目中可能会涉及:
- 创建实际的 SQL 生成器从自然语言输入中产生 SQL 语句
- 使用 DPO 对模型进行对齐后发布到 Hugging Face
企业解决方案
企业环境中,大型语言模型并非单独解决方案,而是整体解决方案中的一部分。在这一段落,课程将探索如何为有大规模员工数量的组织架构解决方案,以及 LLM 如何在其中发挥作用。
示例包括:
- 针对企业大型数据库的自然语言转 SQL 的架构设计
- 使用客户嵌入变革银行业风险评估与产品推荐
如何使用课程
每个部分都分为不同的章节,由多个课时组成。课时标题提供了链接,指向具体的课程页面,包括笔记本和文章。建议同时打开文章和笔记本以更好理解代码和主题。有些提示可能会在笔记本中提供不同的变体,跟随这些提示可以更好地掌握概念。
大多数笔记本托管在 Colab 上,但有些在 Kaggle 上。Colab 和 Kaggle 各有优缺点,视项目需求而定。
贡献与交流
如果您发现项目中存在任何问题,可以打开 issue。您还可以参与 Discussion,提出建议或意见。项目鼓励开放共享,希望学习者之间能互相帮助和交流。
参考文献
课程使用了一系列参考文献,帮助理解和应用技术细节。例如,关于大型语言模型的量化和优化策略,涉及的参考文献有《关于大型语言模型的低秩适配》和《紧凑语言模型:通过剪枝与知识蒸馏》。