热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Qwen2.5-72B
Qwen2.5-72B-Instruct-GGUF - 大语言模型多种量化版本集合 适配不同硬件配置
模型量化
Huggingface
Qwen2.5-72B
内存优化
开源项目
模型
Github
人工智能模型
llama.cpp
该项目提供了Qwen2.5-72B-Instruct模型的18种量化版本,文件大小范围为23GB至77GB。使用llama.cpp的最新量化技术,包括K-quants和I-quants系列。所有版本均经imatrix优化,并更新了上下文长度设置和分词器。项目还提供了详细的性能对比和设备兼容性指南,方便用户根据自身硬件配置选择合适版本。这些模型特别适合在LM Studio等推理引擎上运行。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号