热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Upstage
Upstage-Llama-2-70B-instruct-v2-AWQ - 先进的低比特量化技术优化文本生成模型
Huggingface
文本生成
量化
模型
开源项目
Github
Upstage
Llama 2 70B Instruct v2
Upstage通过AWQ模型实现高效的4比特量化,相较于GPTQ提供更快的推理速度。AWQ支持高吞吐量的多用户服务器环境,可在更小的GPU上运行,从而降低部署成本。此外,模型在多项基准测试中表现卓越,能够在单个48GB GPU上运行70B模型,便于快速部署。了解更多关于该模型的性能和应用场景。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号