热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LLMLingua
LLMLingua - 提示词压缩技术助力大语言模型效率提升
Github
开源项目
大语言模型
推理加速
长文本处理
LLMLingua
提示词压缩
LLMLingua系列是一套创新的提示词压缩工具,可将提示词压缩至原长度的5%,同时保持大语言模型性能。通过小型语言模型识别并移除非必要标记,该技术有效解决长文本处理和上下文遗忘等问题,大幅降低API使用成本并提高推理效率。LLMLingua系列包含三个版本,适用于检索增强生成、在线会议和代码处理等多种场景。
1
1
相关文章
LLMLingua: 突破大语言模型推理瓶颈的高效提示压缩技术
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号