热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LMDeploy
lmdeploy - 优化LLM推理的量化和部署工具
LMDeploy
量化
推理
多模态模型
部署
Github
开源项目
LMDeploy是由MMRazor和MMDeploy团队开发的工具包,专注于LLM的压缩、部署和服务。它提供高效的推理性能、有效的量化方法和便捷的分布式服务,显著提升请求吞吐量。支持多种量化方式和多模型服务,兼容性强。最新版本集成了TurboMind和PyTorch推理引擎,支持多种LLMs和VLMs模型,降低开发者的技术门槛。
1
1
相关文章
LMDeploy: 高效的大语言模型压缩、部署与服务工具包
3 个月前
lmdeploy入门学习资料汇总 - 高效的LLM压缩部署和服务工具包
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号