#模型融合

mergekit - 合并预训练语言模型的工具
mergekitHugging Face模型融合LlamaGPT-NeoXGithub开源项目
MergeKit是一款合并预训练语言模型的工具,支持Llama、Mistral、GPT-NeoX等多种模型。该工具采用先进的方法,在资源有限的情况下执行复杂的合并操作。MergeKit可以在CPU或最低8GB VRAM环境下运行,支持多种合并算法,如线性插值、任务算术、TIES等。还提供图形用户界面并集成到Hugging Face Spaces,简化了模型合并流程。
mergoo - 合并和训练多领域LLM专家的高效工具
MergooLLM专家混合专家Python库模型融合Github开源项目
mergoo是一款工具库,用于高效合并和训练不同领域的LLM专家。支持Mixture-of-Experts、多层合并以及多种训练平台。适配Llama、Mistral、Phi3及BERT模型,兼容CPU、MPS和GPU设备。提供灵活配置及多种训练器支持,包括Hugging Face Trainer和PEFT,以便模型合并与微调。
evolutionary-model-merge - 进化模型合并技术优化人工智能性能
模型融合进化优化EvoLLMEvoVLM人工智能Github开源项目
evolutionary-model-merge项目展示SakanaAI开发的进化模型合并技术。该技术通过优化合并多个源模型,创造性能更优的新模型。项目提供改进的日语语言和视觉语言模型,在数学推理、通用任务和视觉问答方面取得显著提升。项目还包含评估代码和实验结果,为AI研究提供重要资源。
BlockMerge_Gradient - Llama模型层级梯度混合融合工具
BlockMerge Gradient语言模型模型融合梯度值LlamaGithub开源项目
BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具,通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小,可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型,并自动复制相关分词器文件,提供灵活的模型融合方案。
LLaMA2-13B-Tiefighter-GGUF - 融合多种模型的创意写作和对话生成AI
Huggingface模型融合聊天机器人模型Github故事写作开源项目LLaMA2Tiefighter
LLaMA2-13B-Tiefighter-GGUF是一个整合多个先进模型特点的AI系统,主要用于创意写作和对话生成。该模型支持故事创作、聊天机器人开发、指令处理和冒险游戏设计等应用。其特点是灵活性高,即兴创作能力强,适合各类创意输出任务。模型能够通过简单提示生成丰富内容,无需详细指令即可展现想象力。此外,它还支持多种指令格式,可用于各种交互场景。
Hyperlink - 融合多模型优势的写实人像生成AI
模型开源项目Huggingface图像生成Stable DiffusionHyperlinkAI绘图Github模型融合
Hyperlink是一个文本到图像生成模型,结合了DreamPhotoGASM、HyperRealismV1.2和LinkedIn Diffusion的特点。该模型擅长生成细节丰富的写实人像,适用于电影、日常和职场等多种场景。Hyperlink生成的图像具有逼真的面部表情和多样化的风格,为视觉创作提供了新的可能性。
RealTime - 融合多种AI模型生成多样化高质量图像
AI绘图模型图像生成Stable DiffusionGithub模型融合开源项目HuggingfaceReal Time
RealTime是一个结合RealLife v2和Timeless等多个AI模型的图像生成工具。该模型融合了写实和艺术风格,可生成高质量的肖像、风景和抽象图像。RealTime支持多样化的提示词,能创作从写实到超现实的各种风格作品,为创作者提供了丰富的图像生成选择。
CrystalReality - 融合写实与艺术风格的开源图像生成模型
GithubCrystal Reality开源项目人物写实模型融合AI绘画HuggingfaceStable Diffusion模型
CrystalReality是基于CrystalClearRemix和RealisticVision 1.2合并开发的开源图像生成模型。通过特定的模型权重配比,结合了写实风格和艺术效果。该模型在人物肖像生成方面表现突出,能够输出细节丰富的面部特征,并支持多种场景创作,包括时尚人像和自然风光等。
najal-v1-sdxl - 基于Stable Diffusion XL的二次元角色生成模型
Stable Diffusion人工智能艺术开源项目text-to-image模型Huggingface动漫风格模型融合Github
najal-v1-sdxl是一个基于Stable Diffusion XL的动漫角色生成模型,专注于二次元人物和艺术风格创作。该模型基于qelt/merges架构,生成具有美感的动漫角色图像。可用于角色设计和插画制作,支持自定义艺术风格。
Paramount - 多模型融合的高质量AI图像生成项目
模型融合Stable Diffusion人工智能Paramount模型Github图像生成开源项目Huggingface
Paramount是一个开源的AI图像生成项目,融合了Paragon 1.0、AnalogMadness和Analog Diffusion等多个模型。该项目结合了多个模型的特点,可生成高质量的写实照片、复古风格图像和创意场景。通过文本提示,Paramount能够创建各种风格的图像,如电影截图、漫画角色和科幻场景等。这个项目为图像创作提供了多样化的选择,适用于需要生成各类图像的场景。
TickleYourFancy - 融合背景细节与构图优势的Stable Diffusion混合模型
开源项目模型GithubAI绘图stable-diffusion图像生成Huggingface模型融合Tickle Your Fancy
基于DucHaitenFANCYxFANCY和Deliberate 2的混合优化模型,结合了两个基础模型各自的优势。模型在背景处理、画面构图和人物面部细节方面都有良好表现,能够准确还原提示词中的面部特征需求,适合生成高质量的人物肖像画面。
gemma-2-baku-2b-it - 融合指令调优与对话生成的Gemma 2模型
转换器语言模型模型指令微调开源项目HuggingfaceGemma 2模型融合Chat VectorGithub
该模型为rinna/gemma-2-baku-2b的优化版本,采用Chat Vector和ORPO技术,提升了指令跟随和对话生成能力。模型遵循gemma-2的对话格式,具有26层和2304个隐藏单元的transformer架构,通过与google版模型的参数融合实现指令执行,推荐在运行时使用bfloat16精度以优化性能。
ChimeraLlama-3-8B-v3 - 结合多项模型技术的高效文本生成能力
ChimeraLlama-3-8B-v3Huggingface文本生成模型融合Github模型准确率开源项目LLM排行榜
ChimeraLlama-3-8B-v3采用LazyMergekit技术,结合NousResearch、mlabonne、cognitivecomputations等7个模型,为使用者提供高效的文本生成服务。在多个数据集上的表现优异,在IFEval(0-shot)达到了44.08的严格准确率,在MMLU-PRO(5-shot)测试中获得29.65的准确率。其参数配置运用了int8_mask和float16的数据类型,保证高效运行和资源使用优化。利用transformers库可便捷调用和使用该模型,体验其创新文本生成能力。
DarksideRemix - 融合暗黑美学与电影级视觉的AI图像生成模型
文生图Stable DiffusionHuggingfaceGithubDarkside Remix模型融合开源项目模型AI绘图
DarksideRemix是基于DucHaitenDarkside4和DucHaitenDarkside融合开发的AI图像生成模型。该模型支持生成多种风格图像,包括奇幻场景、后启示录风格、电影场景和复古氛围等。主要应用于概念艺术创作、电影分镜设计和艺术插画制作。
Hermes-2-Theta-Llama-3-8B - 融合LLaMA架构的多功能对话语言模型
Llama-3深度学习机器学习HuggingfaceGithub模型融合开源项目人工智能模型
Hermes-2-Theta-Llama-3-8B通过合并Hermes 2 Pro和Llama-3 Instruct两个基础模型,创建了一个功能全面的开源语言模型。经过RLHF强化学习优化后,模型在对话流畅度和任务完成能力上都有显著提升。它不仅支持标准的多轮对话交互,还具备函数调用和结构化数据输出等高级特性,并在AGIEval、GPT4All等多个权威评测中展现出稳定表现。
Sakura-SOLAR-Instruct-CarbonVillain-en-10.7B-v2-slerp - 通过LazyMergekit实现模型融合,探索AI创新应用
模型融合HuggingfaceNeuralPipe-7B-slerpLazyMergekitSakura-SOLAR-Instruct模型Github开源项目CarbonVillain-en-10.7B-v2
NeuralPipe-7B-slerp项目使用LazyMergekit将CarbonVillain-en-10.7B-v2与Sakura-SOLAR-Instruct模型相结合,提供优化的AI解决方案。采用slerp方法实现模型层的组合与自然文本生成,适合多种应用场景。其高效的浮点16位数据类型和自适应设备映射提升性能表现,为AI开发者提供有力支持。