进化模型融合: Sakana AI的创新人工智能技术突破

Ray

进化模型融合:人工智能模型开发的新范式

在人工智能领域,基础模型的训练和开发一直是一项耗时耗力的工作。然而,日本东京的新兴人工智能公司Sakana AI最近提出的"进化模型融合"(Evolutionary Model Merge)技术,为这一领域带来了全新的突破。这项创新技术通过结合现有开源模型的优势,自动化地生成具有新能力的基础模型,为人工智能模型开发开辟了一条全新的道路。

Sakana AI:来自"Transformer之父"的新创公司

Sakana AI于2023年8月正式宣布成立,由包括前Google研究员David Ha和著名论文"Attention Is All You Need"的共同作者Llion Jones在内的一批顶尖AI研究人员联合创立。该公司的核心研究方向是将进化算法、集体智能等自然界启发的思想应用于基础模型的开发中。

进化模型融合:自动化模型开发的新方法

进化模型融合是Sakana AI提出的一种全新的模型开发方法。这种方法借鉴了生物进化的原理,通过"自然选择"的方式自动化地发现最佳的模型组合方式。具体来说,它包括两个关键方面:

  1. 数据流空间(层)融合:使用进化算法来发现不同模型的层的最佳组合方式,形成新的模型架构。

  2. 参数空间(权重)融合:进化出新的方法来混合多个模型的权重,探索无限的权重组合可能性。

这两种方法可以单独使用,也可以结合使用,以发现可能需要特定架构创新的新基础模型。

进化模型融合示意图

与传统的手动模型合并方法相比,进化模型融合具有以下优势:

  • 自动化:无需人工干预,算法可以自动探索和发现最佳的模型组合方式。
  • 创新性:能够发现人类直觉可能难以想到的新颖而有效的模型组合。
  • 高效性:无需额外的梯度训练,可以在较少的计算资源下产生高性能模型。
  • 灵活性:可以针对特定任务或领域自动优化模型性能。

实践案例:日本语言模型的进化

为了验证进化模型融合的有效性,Sakana AI团队首先尝试自动进化出一个能够进行数学推理的日语大型语言模型(LLM)。他们使用进化算法将日语LLM Shisa-Gamma与专门用于数学的LLM WizardMath和Abel进行融合。

经过数百代的进化,最终产生的EvoLLM-JP模型在多项日语LLM基准测试中都取得了出色的成绩。令人惊讶的是,这个仅有70亿参数的模型甚至超越了一些拥有700亿参数的最先进日语LLM的性能。研究人员认为,EvoLLM-JP不仅具备出色的数学推理能力,还可以作为一个通用的日语LLM使用。

跨模态融合:视觉语言模型的突破

Sakana AI团队进一步将进化模型融合技术应用到了跨模态领域。他们尝试将一个流行的开源视觉语言模型(VLM) LLaVA-1.6-Mistral-7B与日语LLM Shisa Gamma 7B v1进行融合,成功进化出了一个高性能的日语VLM——EvoVLM-JP。

在评估中,EvoVLM-JP不仅超越了其英语基础模型LLaVA-1.6-Mistral-7B的性能,还优于现有的日语VLM JSVLM。这个结果充分证明了进化模型融合在跨模态、跨语言模型融合方面的强大潜力。

未来展望:进化AI的兴起

Sakana AI的这项突破性技术为AI模型开发开辟了一条全新的道路。通过利用丰富的开源模型生态系统,大型机构和企业可以采用这种更具成本效益的进化方法来快速开发早期基础模型,而无需投入巨额资源从头开始构建定制模型。

David Ha表示:"通过利用现有开源生态系统中丰富多样的基础模型,大型机构或政府可以考虑采用这种更经济的进化方法来快速开发概念验证原型模型,而无需投入大量资本或动用国家资源从头开发完全定制的模型。"

结语

Sakana AI的进化模型融合技术为AI领域带来了一股清新的气息。它不仅大大降低了开发高性能AI模型的门槛,还为模型开发注入了更多创新的可能性。随着这项技术的不断完善和应用,我们有理由期待看到更多令人惊叹的AI模型诞生,推动整个行业向前发展。

对于想要深入了解或尝试这项技术的读者,Sakana AI已经在GitHub上开源了相关代码和模型,欢迎大家访问https://github.com/SakanaAI/evolutionary-model-merge进行探索。让我们一起期待进化AI带来的更多惊喜吧!

avatar
0
0
0
相关项目
Project Cover

mergekit

MergeKit是一款合并预训练语言模型的工具,支持Llama、Mistral、GPT-NeoX等多种模型。该工具采用先进的方法,在资源有限的情况下执行复杂的合并操作。MergeKit可以在CPU或最低8GB VRAM环境下运行,支持多种合并算法,如线性插值、任务算术、TIES等。还提供图形用户界面并集成到Hugging Face Spaces,简化了模型合并流程。

Project Cover

mergoo

mergoo是一款工具库,用于高效合并和训练不同领域的LLM专家。支持Mixture-of-Experts、多层合并以及多种训练平台。适配Llama、Mistral、Phi3及BERT模型,兼容CPU、MPS和GPU设备。提供灵活配置及多种训练器支持,包括Hugging Face Trainer和PEFT,以便模型合并与微调。

Project Cover

evolutionary-model-merge

evolutionary-model-merge项目展示SakanaAI开发的进化模型合并技术。该技术通过优化合并多个源模型,创造性能更优的新模型。项目提供改进的日语语言和视觉语言模型,在数学推理、通用任务和视觉问答方面取得显著提升。项目还包含评估代码和实验结果,为AI研究提供重要资源。

Project Cover

BlockMerge_Gradient

BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具,通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小,可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型,并自动复制相关分词器文件,提供灵活的模型融合方案。

Project Cover

LLaMA2-13B-Tiefighter-GGUF

LLaMA2-13B-Tiefighter-GGUF是一个整合多个先进模型特点的AI系统,主要用于创意写作和对话生成。该模型支持故事创作、聊天机器人开发、指令处理和冒险游戏设计等应用。其特点是灵活性高,即兴创作能力强,适合各类创意输出任务。模型能够通过简单提示生成丰富内容,无需详细指令即可展现想象力。此外,它还支持多种指令格式,可用于各种交互场景。

Project Cover

Hyperlink

Hyperlink是一个文本到图像生成模型,结合了DreamPhotoGASM、HyperRealismV1.2和LinkedIn Diffusion的特点。该模型擅长生成细节丰富的写实人像,适用于电影、日常和职场等多种场景。Hyperlink生成的图像具有逼真的面部表情和多样化的风格,为视觉创作提供了新的可能性。

Project Cover

RealTime

RealTime是一个结合RealLife v2和Timeless等多个AI模型的图像生成工具。该模型融合了写实和艺术风格,可生成高质量的肖像、风景和抽象图像。RealTime支持多样化的提示词,能创作从写实到超现实的各种风格作品,为创作者提供了丰富的图像生成选择。

Project Cover

CrystalReality

CrystalReality是基于CrystalClearRemix和RealisticVision 1.2合并开发的开源图像生成模型。通过特定的模型权重配比,结合了写实风格和艺术效果。该模型在人物肖像生成方面表现突出,能够输出细节丰富的面部特征,并支持多种场景创作,包括时尚人像和自然风光等。

Project Cover

najal-v1-sdxl

najal-v1-sdxl是一个基于Stable Diffusion XL的动漫角色生成模型,专注于二次元人物和艺术风格创作。该模型基于qelt/merges架构,生成具有美感的动漫角色图像。可用于角色设计和插画制作,支持自定义艺术风格。

最新项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号