#Self-Speculative Decoding

Self-Speculative Decoding: 大语言模型推理加速的创新方法

2 个月前

Self-Speculative Decoding LLM加速推理优化草稿验证层跳过 Github 开源项目

2 个月前

相关项目

self-speculative-decoding

Self-Speculative Decoding是ACL 2024的一个开源项目，提出了一种无损加速大型语言模型（LLMs）的新方法。该技术通过草稿生成和验证两个阶段，在不增加额外训练和内存的情况下提高LLM推理速度。这一创新方案保证了输出质量和模型兼容性，为LLM加速提供了高效且易于实施的解决方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com