LLM（大型语言模型）微调项目和常见实用技术笔记

笔记本	🟠 YouTube视频
使用Unsloth 4bit量化与ORPO微调Llama-3-8B
在自定义数据集上使用Unsloth微调Llama-3
CodeLLaMA-34B——对话代理
使用KV缓存推断Yarn-Llama-2-13b-128k回答非常长的教科书上的问题
使用PEFT和QLORA微调Mistral 7B
在OpenAssistant-Guanaco上微调Falcon
使用PEFT和QLORA微调 Phi 1_5
使用AnthropicAI和LangChainAI进行大语言模型（LLM）爬网

笔记本	Colab
📌 全精度Gemma-2b微调ORPO
📌 Jamba_Colab-Pro微调
📌 使用QLoRA微调CodeLama-34B
📌 使用Gradio的Mixtral聊天机器人
📌 使用TogetherAI的 Mixtral
📌 与LangChain整合TogetherAI 🦙
📌 Mistral-7B-Instruct_GPTQ - 在finance-alpaca数据集上微调 🦙
📌 DPO直接偏好优化微调Mistral 7B
📌 微调Llama_2_GPTQ
📌 使用Unsloth和RoPE扩展的TinyLlama与Dolly-15k数据集
📌 使用Taylor_Swift歌曲歌词微调Tinyllama

LLM 概念
📌 DPO (直接偏好优化) 训练及其数据集
📌 使用 GPTQ 的 4 位 LLM 量化
📌 使用 HF Transformers 进行量化
📌 理解 LoRA 中的等级 r 和相关矩阵数学
📌 旋转嵌入 (RopE) 是 LlaMA-2 实现的基本构建模块之一
📌 HuggingFace 中的聊天模板
📌 Mixtral 8x7B 是如何成为一个致密的 47Bn 参数模型
📌 LLM 训练中的验证对数困惑度概念 - 基础知识笔记
📌 为什么需要识别 LoRA/QLoRA 的 `目标层`
📌 每秒令牌评估
📌 遍历 PyTorch 模块的嵌套属性（或子模块）
📌 从 Mistral 官方仓库在 PyTorch 中实现稀疏专家混合层
📌 用于从 transformer 模型的最后隐藏状态中提取特定令牌表示的工具方法
📌 将 PyTorch 模型的参数和张量转换为半精度浮点格式
📌 使用 GPTQ 方法量化 🤗 Transformers 模型
📌 将 Mixtral-8x7B 量化以便在 24GB GPU 上运行
📌 在大型语言模型的世界中，什么是 GGML 或 GGUF？