热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#NVLM-D-72B
NVLM-D-72B-nf4 - 多模态模型NF4量化与性能优化研究
Github
开源项目
模型
模型转换
量化
Huggingface
GPU内存
图像文本生成
NVLM-D-72B
NVLM-D-72B模型NF4量化转换项目利用BitsAndBytes技术实现双重量化,旨在优化性能。目前纯文本处理表现出色,但图像处理功能仍需完善。项目优化了modeling_intern_vit.py文件,提高了量化模块兼容性。模型运行需48GB以上显存,遵循CC BY-NC 4.0许可。该项目为探索大型多模态模型量化提供了宝贵经验。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号