热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Marlin格式
zephyr-7b-beta-marlin - 适用于高效4比特推理的LLM模型优化技术
模型量化
Huggingface
开源项目
模型
推理优化
Github
Marlin格式
zephyr-7b-beta
nm-vllm
项目提供的zephyr-7b-beta模型在GPTQ量化后以Marlin格式保存,专为nm-vllm引擎高效推理优化。该模型支持在本地Python环境中部署,代码示例以及详细指导文档可供参考,确保对量化模型优势的完整展现。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号