热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#安全分类
LlamaGuard-7B-AWQ - 使用低位量化技术提升模型推理速度和效率
AWQ
Github
模型
开源项目
安装指南
LlamaGuard 7B
安全分类
Huggingface
模型量化
LlamaGuard-7B-AWQ采用了AWQ的4位量化技术,提升了模型在Linux和Windows平台上的推理效率和精度,需使用NVidia GPU。此模型相较于传统GPTQ设置,具备更快速度和良好的输出质量,兼容Text Generation Webui、vLLM及Transformers等系统,支持多用户推理服务,适合对时延和精度有较高要求的应用场景。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号