热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#vllm
llm-compressor - 开源大型语言模型压缩优化库
LLM Compressor
量化
模型优化
vllm
Hugging Face
Github
开源项目
llm-compressor是一个专注于大型语言模型优化和压缩的开源库。它提供全面的量化算法集,支持权重和激活量化,并与Hugging Face模型和仓库无缝集成。该项目采用safetensors文件格式,确保与vllm兼容,同时通过accelerate支持大规模模型处理。llm-compressor涵盖多种量化格式和算法,包括激活量化、混合精度和稀疏化技术,为模型优化提供灵活多样的选择。
1
1
相关文章
LLM Compressor: 优化大语言模型部署的利器
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号