#OmniQuant

OmniQuant入门学习资料-Omnidirectionally Calibrated Quantization for LLMs

2 个月前

OmniQuant 量化大语言模型 LLaMA 高效QAT Github 开源项目

2 个月前

OmniQuant: 大语言模型的全方位校准量化技术

3 个月前

OmniQuant 量化大语言模型 LLaMA 高效QAT Github 开源项目

3 个月前

相关项目

OmniQuant

OmniQuant是一种高效的量化技术，支持多种大型语言模型（LLM）的权重和激活量化，包括LLaMa和OPT等。其实现了4位及更低精度的权重量化，并通过MLC-LLM优化在多种硬件设备上的推理性能和内存占用。此外，项目还支持Mixtral和Falcon模型的压缩应用，大幅降低内存需求，提高运行效率。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com