#LongRoPE

LongRoPE：突破200万token的大语言模型上下文窗口扩展技术

3 个月前

LongRoPE 大语言模型上下文窗口位置编码 Transformer Github 开源项目

3 个月前

相关项目

LongRoPE

LongRoPE项目提出了一种将大语言模型（LLM）上下文窗口扩展至超过200万个标记的方法。通过利用位置嵌入中的非均匀性，项目实现了8倍的上下文窗口扩展，无需微调。采用逐步扩展策略从256k微调至2048k上下文，避免了对超长文本的直接微调。LongRoPE还调整了原始窗口长度内的嵌入，确保在各种任务中保持高效表现，适用于对话、问答、长文档摘要及少样本学习。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com