热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#人工智能推理
Reflection-Llama-3.1-70B-GGUF - Llama-3.1-70B模型的GGUF量化版本集合
Github
模型
开源项目
深度学习
GPU内存优化
Huggingface
Llama
人工智能推理
模型量化
Reflection-Llama-3.1-70B模型的GGUF量化集合,包含从74.98GB到22.24GB的多个版本。采用K-quants和I-quants量化技术,并对embed和output权重进行了特别处理。项目提供了详细的版本特性说明、安装指南以及基于不同硬件配置的选型建议。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号