#无限长度输入

StreamingLLM: 实现大语言模型的无限长度输入处理

2024年09月05日

2024年09月05日

相关项目

streaming-llm

StreamingLLM是一个创新框架，使大型语言模型能处理超长输入序列。它通过注意力汇聚点技术解决了长文本处理的内存和性能问题，无需额外微调。在多轮对话等流式应用中，StreamingLLM比基线方法速度提升最高22.2倍。该技术已被多个知名项目采用，为语言模型的实际应用开辟了新途径。

投诉举报邮箱: service@vectorlightyear.com