#EfficientQAT

EfficientQAT: 大语言模型高效量化感知训练的革新技术

2024年09月05日

EfficientQAT 大语言模型量化训练模型压缩 PyTorch Github 开源项目

2024年09月05日

EfficientQAT: 高效的大型语言模型量化感知训练方法

2024年09月05日

EfficientQAT 大语言模型量化训练模型压缩 PyTorch Github 开源项目

2024年09月05日

相关项目

EfficientQAT

EfficientQAT是一种针对大型语言模型的量化训练技术。该技术采用两阶段训练方法,包括分块训练所有参数和端到端训练量化参数,在压缩模型大小的同时保持性能。EfficientQAT支持GPTQ和BitBLAS等多种量化格式,已成功应用于Llama和Mistral等模型系列,有效降低模型存储需求,为大型语言模型的部署提供了实用方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com