Logo

#模型融合

MergeKit入门指南 - 强大的预训练语言模型合并工具包

1 个月前
Cover of MergeKit入门指南 - 强大的预训练语言模型合并工具包

进化模型融合: Sakana AI的创新人工智能技术突破

2 个月前
Cover of 进化模型融合: Sakana AI的创新人工智能技术突破

BlockMerge Gradient: 革新性的语言模型融合技术

2 个月前
Cover of BlockMerge Gradient: 革新性的语言模型融合技术

MergeKit: 一个强大的预训练语言模型合并工具包

2 个月前
Cover of MergeKit: 一个强大的预训练语言模型合并工具包

相关项目

Project Cover
mergekit
MergeKit是一款合并预训练语言模型的工具,支持Llama、Mistral、GPT-NeoX等多种模型。该工具采用先进的方法,在资源有限的情况下执行复杂的合并操作。MergeKit可以在CPU或最低8GB VRAM环境下运行,支持多种合并算法,如线性插值、任务算术、TIES等。还提供图形用户界面并集成到Hugging Face Spaces,简化了模型合并流程。
Project Cover
mergoo
mergoo是一款工具库,用于高效合并和训练不同领域的LLM专家。支持Mixture-of-Experts、多层合并以及多种训练平台。适配Llama、Mistral、Phi3及BERT模型,兼容CPU、MPS和GPU设备。提供灵活配置及多种训练器支持,包括Hugging Face Trainer和PEFT,以便模型合并与微调。
Project Cover
evolutionary-model-merge
evolutionary-model-merge项目展示SakanaAI开发的进化模型合并技术。该技术通过优化合并多个源模型,创造性能更优的新模型。项目提供改进的日语语言和视觉语言模型,在数学推理、通用任务和视觉问答方面取得显著提升。项目还包含评估代码和实验结果,为AI研究提供重要资源。
Project Cover
BlockMerge_Gradient
BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具,通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小,可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型,并自动复制相关分词器文件,提供灵活的模型融合方案。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号