BlockMerge_Gradient
BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具,通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小,可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型,并自动复制相关分词器文件,提供灵活的模型融合方案。