#显存优化

Replete-LLM-V2.5-Qwen-7b-GGUF - Qwen-7b模型GGUF量化版本集合适配多种硬件配置

显存优化机器学习GithubHuggingfaceQwen量化模型开源项目模型GGUF

Replete-LLM-V2.5-Qwen-7b-GGUF是经LLAMA.cpp量化处理的Qwen-7b模型系列，提供24种不同量化版本。从15.24GB的F16到2.78GB的IQ2_M，涵盖多种规格以适应不同硬件。支持CPU和GPU部署，并为ARM架构优化。采用imatrix量化方案，附有详细性能说明，便于选择合适版本。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号