#低秩适应

SiLLM: 基于大型语言模型的同声传译框架

2 个月前

SiLLM是一个创新的同声传译框架,利用大型语言模型作为翻译模型,同时采用传统的同声传译模型进行策略决策,通过两者的协作实现高效的同声传译。

SiLLM 大型语言模型 Apple Silicon MLX 低秩适应 Github 开源项目

2 个月前

DoRA: 革新性的低秩适应方法在人工智能领域的应用与发展

2 个月前

DoRA（Weight-Decomposed Low-Rank Adaptation）是一种创新的低秩适应方法，旨在提高人工智能模型的性能和适应性。本文深入探讨了DoRA的工作原理、应用场景及其在AI领域的重要意义。

DoRA 低秩适应权重分解微调大语言模型 Github 开源项目

2 个月前

LoraHub: 动态LoRA组合实现高效跨任务泛化

2 个月前

LoraHub是一个创新的框架，通过动态组合多个LoRA模块，实现了高效的跨任务泛化能力。本文深入介绍了LoraHub的工作原理、主要特点及其在大语言模型微调领域的重要意义。

LoraHub 低秩适应跨任务泛化大语言模型动态组合 Github 开源项目

2 个月前

Mix-of-Show:多概念定制化扩散模型的去中心化低秩适应

2 个月前

Mix-of-Show是一种新的扩散模型多概念定制化方法,通过去中心化低秩适应实现高效的模型扩展和概念融合,支持单概念和多概念的高质量图像生成。

Mix-of-Show 扩散模型多概念定制低秩适应 AI绘图 Github 开源项目

2 个月前

LoRA+: 大型模型高效低秩适应的创新之路

2 个月前

探索LoRA+如何通过引入新的超参数来优化大型语言模型的微调过程,提高下游任务的性能表现。

LoRA+模型微调低秩适应超参数优化 ICML 2024 Github 开源项目

2 个月前

PiSSA: 大型语言模型的主成分奇异值和奇异向量自适应方法

2 个月前

PiSSA是一种新型参数高效的大语言模型微调方法，通过优化模型的主要奇异值和奇异向量来实现更快的收敛和更好的性能。本文详细介绍了PiSSA的原理、优势及其在多个基准测试中的出色表现。

PiSSA 参数高效微调大语言模型低秩适应奇异值分解 Github 开源项目

2 个月前

PiSSA: 大语言模型的主成分奇异值和奇异向量适应方法

2 个月前

PiSSA是一种新型的参数高效微调技术,通过优化大语言模型中的主要奇异值和奇异向量来实现快速收敛和卓越性能。本文深入探讨了PiSSA的原理、优势及其在多个基准测试中的出色表现。

PiSSA 参数高效微调大语言模型低秩适应奇异值分解 Github 开源项目

2 个月前

相关项目

lorahub

LoraHub框架通过组合多个LoRA模块实现跨任务泛化。该项目仅需少量样例即可适应新任务，无需额外参数或训练。LoraHub提供完整代码和预训练模型，支持pip安装。在BIG-Bench Hard基准测试中，LoraHub性能接近少样本上下文学习，推理速度与零样本学习相当。

Mix-of-Show

Mix-of-Show是一种扩散模型多概念定制技术,通过去中心化低秩适应实现单概念和多概念融合。它可生成高质量动漫和真实人物图像,无需正则化数据集,支持区域可控的多概念采样。该项目开源了训练和推理代码,为扩散模型个性化提供新方案。

DoRA

DoRA是一种新型大型语言模型微调方法，通过将预训练权重分解为幅度和方向两个部分进行更新。与LoRA相比，DoRA在保持参数效率的同时提升了模型的学习能力和训练稳定性。研究表明，DoRA在常识推理、视觉指令调优和图像/视频-文本理解等多项下游任务中表现优于LoRA。该技术已集成到Hugging Face PEFT和Diffusers库中，可用于多种模型的微调。

PiSSA

PiSSA是一种创新的参数高效微调方法，通过优化关键奇异值和向量来增强大语言模型性能。相较于LoRA，PiSSA展现出更快的收敛速度和更优的效果。在多个基准测试中，PiSSA的表现全面超越LoRA。这种方法不仅保留了LoRA的参数效率和量化兼容性优势，还大幅降低了4位量化误差。PiSSA初始化迅速，易于从LoRA转换。在多种模型和任务中，PiSSA均表现出色，为大语言模型的高效微调提供了新的可能性。

loraplus

LoRA+是一种创新的低秩适应技术，专注于提高大型模型的微调效率。该技术引入新的超参数优化训练过程，尤其适合处理复杂的下游任务。项目提供完整代码实现，兼容Hugging Face Trainer和自定义训练流程，并附带GLUE基准测试和图像分类示例。LoRA+在多种任务中表现出色，为研究人员和开发者提供了改进大型模型微调效果的有力工具。

SiLLM

SiLLM是专为Apple Silicon设计的大语言模型工具包，基于MLX框架优化LLM训练和运行流程。支持多种模型架构，提供Web应用和API服务，实现LoRA和DPO等先进训练技术。该项目还引入控制向量和特征消融等实验性功能，便于探索LLM内部机制，旨在让更广泛的Apple Silicon用户群体能够使用最新的LLM技术。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com