Firefly - 开源大模型训练平台

Firefly 项目介绍

项目概述

Firefly 是一个开源的大模型训练工具，设计用于支持主流大模型的预训练和微调。此项目特别适合对大模型进行指令微调，包括但不限于 Llama3、Baichuan、ChatGLM 等知名模型。Firefly 支持不同的训练模式，包括全量参数训练、LoRA 和 QLoRA 高效训练，并已在 Open LLM Leaderboard 上展示了其卓越的性能。

核心功能

多种训练模式：Firefly 项目支持全量参数训练、LoRA、QLoRA 等多种高效训练方法，无论是预训练还是指令微调都能胜任。这让用户能够根据自身资源情况选择合适的训练方式。
支持多种主流大模型：项目可以支持市面上大多数的开源大模型，包括但不限于 Llama 系列、MiniCPM、InternLM、Gemma 等。在训练过程中，能与各官方模型的 chat 模板对齐。
Unsloth 加速支持：使用 Unsloth 可以加速训练并节省显存，使得即便是显存相对较小的设备也能运行大模型训练任务。
丰富的数据集：开源了多种指令微调数据集，如 firefly-train-1.1M 和 ultrachat 等，方便用户快速进行多语言和多任务的模型训练。
开源模型：提供不同模型的预训练和微调模型权重，方便开发者直接应用于具体场景。