#Lookahead Decoding

突破顺序依赖：Lookahead Decoding加速大语言模型推理

3 个月前

Lookahead Decoding LLM 并行解码推理加速 Jacobi迭代 Github 开源项目

3 个月前

相关项目

LookaheadDecoding

LookaheadDecoding项目开发了一种创新的并行解码算法，旨在加速大型语言模型(LLM)的推理过程。该方法不依赖草稿模型或数据存储，而是结合Jacobi迭代和n-gram缓存技术，有效减少解码步骤。实验结果显示，在多个数据集上可将延迟降低1.5到2.3倍。项目提供便捷的安装和使用方式，并支持FlashAttention技术，可广泛应用于各类LLM场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com