#神经网络优化
model_optimization - 开源神经网络模型压缩与优化工具集
Model Compression ToolkitMCT神经网络优化量化模型压缩Github开源项目
Model Compression Toolkit (MCT)是一个专注于神经网络模型优化的开源项目,旨在满足高效硬件约束下的部署需求。MCT提供多种量化方法,包括训练后量化和基于梯度的训练后量化,同时支持数据生成和结构化剪枝等功能。此工具集还具备针对特定目标平台的优化能力,为研究人员和开发者提供了全面的模型压缩解决方案。
Mistral-Nemo-Instruct-2407-gptq-4bit - 采用GPTQ技术的4位量化语言模型
开源项目模型GPTQModel神经网络优化模型压缩低位量化量化模型GithubHuggingface
Mistral-Nemo-Instruct-2407-gptq-4bit是一个使用GPTQModel进行4位量化的语言模型。该模型采用128组大小和真实顺序等技术,在维持性能的同时大幅缩减模型体积。这种量化方法提高了模型的部署效率,适用于计算资源有限的场景。