bagel
Bagel是一个综合性大语言模型训练框架,融合多种数据源和先进技术。该项目利用多样化数据集进行监督微调(SFT)和直接偏好优化(DPO),包括指令、对话和纯文本数据。Bagel采用vicuna、llama-2、alpaca和chat-ml等多种提示格式,旨在提升模型泛化能力。通过SFT和DPO两阶段训练,Bagel致力于打造功能完善、性能优异的语言模型。