#LongQLoRA

LongQLoRA: 高效扩展大型语言模型上下文长度的创新方法

2 个月前

LongQLoRA 大语言模型上下文长度扩展低资源训练性能评估 Github 开源项目

2 个月前

相关项目

LongQLoRA

LongQLoRA是一种扩展大语言模型上下文长度的方法，可在单个32GB V100 GPU上将LLaMA2模型的上下文长度从4096扩展到8192。该方法在PG19和Proof-pile数据集上表现优异，仅需1000步微调即可达到接近MPT-7B-8K的性能。项目还提供了预训练数据集、指令微调数据集以及扩展上下文长度的模型。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com