#LoRA

Vicuna-LoRA-RLHF-PyTorch: 一套完整的大规模语言模型微调流程

3 个月前

Vicuna-LoRA-RLHF-PyTorch Vicuna LoRA RLHF PyTorch Github 开源项目

3 个月前

LoRA和DoRA:从零开始实现低秩适应技术

3 个月前

LoRA DoRA 实现补充资料文章 Github 开源项目

3 个月前

LLMtuner: 一种简化大型语言模型微调的开源框架

3 个月前

LLMTuner LLM微调 LoRA Whisper Llama Github 开源项目

3 个月前

Stable Diffusion: 革命性的AI图像生成技术

3 个月前

Stable Diffusion Automatic1111 Web UI DreamBooth 教程视频 LoRA Github 开源项目

3 个月前

ChatGenTitle: 基于LLaMA模型的论文标题生成利器

3 个月前

ChatGenTitle LLaMa模型论文生成 arXiv LoRA Github 开源项目

3 个月前

LongLoRA: 高效微调长上下文大语言模型

3 个月前

LongAlpaca 长上下文语言模型 LLaMA2 LoRA 深度学习 Github 开源项目

3 个月前

Punica: 高效服务多个LoRA微调大语言模型

3 个月前

Punica LoRA 模型微调高效计算多租户服务 Github 开源项目

3 个月前

LLM微调技术全面指南:方法、最佳实践与应用

3 个月前

PEFT LoRA Hugging Face 大型语言模型微调 Github 开源项目

3 个月前

xTuring: 构建、定制和控制您自己的大型语言模型

3 个月前

xTuring LLM LLaMA LoRA INT4 Github 开源项目

3 个月前

PEFT: 高效参数微调方法助力大型语言模型

3 个月前

PEFT Transformers Diffusers LoRA Accelerate Github 开源项目

3 个月前

相关项目

simple-llm-finetuner

Simple LLM Finetuner项目提供了初学者友好的界面，利用LoRA方法和PEFT库在常见的NVIDIA GPU上微调语言模型。用户可以轻松管理数据集、定制参数，并评估模型推理能力。支持在UI中粘贴数据集，提供参数调整和详细说明。尽管项目已停止维护，建议使用替代工具如LLaMA-Factory、unsloth或text-generation-webui。

peft

参数高效微调（PEFT）通过只调整少量额外参数来适配大规模预训练模型，大幅降低计算和存储成本，同时性能接近完全微调模型。PEFT与Transformers、Diffusers和Accelerate集成，支持多种下游任务的训练和推理。了解更多方法和优势，请访问官方文档和教程。

xTuring

xTuring是一款高效、简单的开源LLM微调平台，支持Mistral、LLaMA、GPT-J等多种模型。用户可通过直观界面在本地或私有云中微调模型，保障数据隐私。平台支持数据预处理、多GPU扩展、以及INT4和LoRA等内存高效的微调方法，并提供多种模型评估工具。最新功能涵盖LLaMA 2集成、CPU推理优化和批量处理。

LLM-Finetuning

了解如何使用LoRA和Hugging Face Transformers库高效微调大型语言模型。项目提供详细的教程笔记本，包括在Colab中微调Llama 2、GPT-Neo-X-20B、MPT-Instruct-30B等模型的指导和代码示例。无论新手或专家，均可找到实用资源，提升语言模型性能。欢迎贡献和提交问题，共同完善此开源项目。

punica

Punica采用分段聚集矩阵-向量乘法（SGMV）技术，使多个LoRA微调模型在单个预训练模型上高效运行，仅增加1%的存储和内存开销。相比其他系统，Punica在各种LoRA模型请求下的文本生成吞吐量提升至12倍，适用于不同版本的CUDA和Python，支持二进制包和源码构建。

Stable-Diffusion

探索Dr. Furkan Gözükara领导的Stable Diffusion项目。通过全面的高级教程视频，涵盖自动化Web UI安装至模型训练，与我们一起从基础到专家，深入理解并运用Stable Diffusion技术。包含Google Colab和Automatic1111 Web UI的实操演示，适合所有技术爱好者。

LongLoRA

LongLoRA项目开发了一种高效微调方法，处理大型长上下文语言模型，涵盖了从7B至70B的各种模型规模和LongAlpaca-12k实验性数据集。项目支持多种微调方式，在基凊测试中验证了模型性能，技术可应用于多种NLP任务，助力复杂语言处理。实现显著性能优势，为企业和研究人员在从机器翻译到自动摘要等NLP任务中提供了有效的解决方案。

ChatGenTitle

ChatGenTitle是一个使用LoRA微调技术基于百万arXiv论文数据微调LLaMA模型的开源论文标题生成工具。提供有效支持以便科研人员高效生成论文标题，所有代码和模型权重开源供本地部署使用。

LoRA

LoRA通过低秩分解矩阵实现大型语言模型的低秩适配，减少了训练参数数量，实现高效的任务切换和存储节省。它在GLUE基准测试中的表现与完全微调相当或更好，同时显著降低了参数需求。LoRA支持RoBERTa、DeBERTa和GPT-2等模型，并已集成到Hugging Face的PEFT库中，提供了便捷的适配解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com