热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#TinyLlama-1.1B-Chat-v1.0
TinyLlama-1.1B-Chat-v1.0-marlin - TinyLlama-1.1B量化推理解决方案
Github
开源项目
模型
推理
量化
Huggingface
Neural Magic
TinyLlama-1.1B-Chat-v1.0
基于模型
本项目提供了一种以TinyLlama-1.1B为基础的量化聊天模型,运用GPTQ技术实现内存优化与推理加速,支持高效的4位推理。借助nm-vllm引擎,用户能快速实现部署,并可通过Python管道进行本地推理。详细的量化与Marlin格式转换流程保障了模型的高效表现。此外,Neural Magic的Slack社区欢迎加入以获取支持和交流更多关于神经网络及AI的资讯。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号