#LLM微调
h2o-llmstudio - 轻松微调大型语言模型的无代码图形界面
H2O LLM StudioLLM微调无代码界面图形用户界面Nvidia GPUGithub开源项目
H2O LLM Studio 提供无代码图形界面,轻松微调大型语言模型。支持多种超参数调整,包括LoRA和8位模型训练技术,甚至还可使用强化学习。用户可以可视化跟踪模型性能,并与模型互动获取即时反馈。支持将模型导出至 Hugging Face Hub,方便与社区分享。
LLMtuner - 使用 LoRA、QLoRA 等最佳实践对 Llama、Whisper 和其他 LLM 进行微调
LLMTunerLLM微调LoRAWhisperLlamaGithub开源项目
LLMTuner 提供类 scikit-learn 接口,让用户便捷微调如 Llama、Whisper 等大型语言模型。通过 LoRA 和 QLoRA 等技术实现高效微调,内置推理功能和一键启动的交互式 UI,简化模型展示和共享。此外,LLMTuner 还支持未来在 AWS 和 GCP 等平台上的部署。欢迎加入 PromptsLab 社区,探索和讨论最新的开源模型调优技术。
LLM-Finetuning-Toolkit - 配置化CLI工具,用于LLM微调和实验管理
LLM Finetuning ToolkitCLI工具LLM微调配置文件实验Github开源项目
该工具通过yaml配置文件进行管理,支持LLM微调的各个方面,包括提示词、模型、优化策略和测试。用户可以通过pipx或pip安装,并按照提供的指南进行使用,涵盖基础到高级的使用场景。实验结果会被自动记录和保存。工具的模块化设计允许进一步扩展和定制。
NEFTune - 革新语言模型指令微调的噪声嵌入技术
NEFTuneLLM微调嵌入向量噪声增强性能提升Github开源项目
NEFTune是一种创新的语言模型指令微调技术,通过向嵌入向量添加随机噪声来提升模型性能。这种方法无需额外计算资源或数据,却能显著改善对话质量。在AlpacaEval评估中,NEFTune将LLaMA-2-7B模型的性能从29.8%提升至64.7%。作为一种高效的LLM微调方案,NEFTune为模型优化提供了低成本、高收益的解决方案。
llm-finetuning - Modal和axolotl驱动的大语言模型高效微调框架
LLM微调ModalaxolotlDeepSpeedLoRAGithub开源项目
这个开源项目整合了Modal和axolotl,为大语言模型微调提供了一个高效框架。它采用Deepspeed ZeRO、LoRA适配器和Flash Attention等先进技术,实现了高性能的模型训练。该框架支持云端部署,简化了资源管理流程,并可灵活适配不同模型和数据集。项目还提供了全面的配置说明和使用指南,方便开发者快速上手和定制化应用。
相关文章