热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#多头解码
medusa-vicuna-7b-v1.3 - 采用多解码头技术的LLM加速框架
Github
开源项目
深度学习
模型
推理
Huggingface
Medusa
加速
多头解码
Medusa是一个通过多解码头技术加速LLM生成的开源框架,支持7B、13B和33B模型权重。提供便捷的pip安装和源码构建选项,允许自定义模型格式加载。支持单GPU推理,未来将集成更多推理框架,开放社区贡献。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号