Project Icon

Medusa

使用多个解码头加速 LLM 生成的简单框架

Medusa框架通过多解码头技术加速大型语言模型(LLM)的生成,解决了草稿模型需求、系统复杂性和采样生成效率低的问题。在保持原模型性能的基础上,Medusa通过添加新解码头预测多个未来词,显著提升生成速度。最新的Medusa-2版本支持全模型训练和自我蒸馏,使任何微调后的LLM都能利用Medusa,无需原始训练数据。测试显示在不同LLM上提升了2.2-3.6倍的速度。

Medusa 项目介绍

Medusa 是一个简单的框架,旨在通过多解码头来加速大语言模型(LLM)的生成过程。该项目的目标是使加速技术更加普及,并在不引入新模型的情况下,通过同一模型训练多个解码头来实现这一目标。通过这一创新,Medusa 解决了普遍加速技术中的三大痛点:对良好草案模型的需求、系统复杂性以及使用基于采样的生成时的低效问题。

多解码头的实现

Medusa 的核心理念是为现有的 LLM 增加多个“解码头”,以同时预测多个未来词汇。在这一过程中,Medusa 不会对原始模型进行更改,而是仅在训练期间微调新的解码头。这些解码头在生成时,各自为相应位置生成多个可能的词汇选项。然后,这些选项通过一种基于树的注意力机制进行结合和处理,最终采用常规的接受方案选出最长的合理前缀,以用于后续解码。

优化与支持

在最初版本中,Medusa 重点优化了批量大小为1的环境,这是本地模型托管中最常用的设置。在此配置下,Medusa 在各种 Vicuna 模型上实现了大约2倍的速度提升。项目团队正在积极拓展 Medusa 的能力,计划将 Medusa 集成到更多的推理框架中,以实现更高的性能提升并将其推广到更广泛的应用场景。

新功能与版本

更新版本(即 Medusa-2)增加了对全模型训练的支持,提供了一种特别的训练方案,该方案具备在保持原始模型性能的同时,增加预测能力。此外,Medusa 也增加了自蒸馏支持,使其能够在无需原始训练数据的情况下,加入到任何经过微调的 LLM 中。

安装与使用

Medusa 的安装推荐从源代码进行,以保持最新版本。用户可以通过以下方法安装 Medusa:

  • 方法 1:使用 pip 安装(可能不是最新版本)
    pip install medusa-llm
    
  • 方法 2:从源代码安装(推荐)
    git clone https://github.com/FasterDecoding/Medusa.git
    cd Medusa
    pip install -e .
    

此外,Medusa 还提供了一些模型权重以及在单 GPU 上进行批量大小为1的推理支持。用户可根据需求通过命令行接口来进行推理,支持8bit或4bit的量化加载。

示例与贡献

Medusa 也被许多开源项目采用,如 NVIDIA 的 TensorRT-LLM、Hugging Face 的 TGI,以及阿里巴巴的 RTP-LLM。项目团队期待与更多的社区成员分享经验,欢迎有兴趣的开发者通过 GitHub 进行讨论和贡献。项目的路线图中列出了未来的计划,欢迎大家参与。

Medusa 受到了众多项目和机构支持,如 Together AI、MyShell AI 和 Chai AI,帮助加速了 LLM 的发展。Medusa 希望能为更多的研究者和开发者提供帮助,加速大语言模型的开发。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号