#Upstage

Upstage-Llama-2-70B-instruct-v2-AWQ - 先进的低比特量化技术优化文本生成模型

Huggingface文本生成量化模型开源项目GithubUpstageLlama 2 70B Instruct v2

Upstage通过AWQ模型实现高效的4比特量化，相较于GPTQ提供更快的推理速度。AWQ支持高吞吐量的多用户服务器环境，可在更小的GPU上运行，从而降低部署成本。此外，模型在多项基准测试中表现卓越，能够在单个48GB GPU上运行70B模型，便于快速部署。了解更多关于该模型的性能和应用场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号