热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#多模型兼容
InferLLM - 轻量化语言模型推理框架,兼容多种模型格式和设备
InferLLM
llama.cpp
模型推理
高效率
多模型兼容
Github
开源项目
InferLLM 是一个高效简洁的语言模型推理框架,源于 llama.cpp 项目。主要特点包括结构简单、高性能、易于上手,并支持多模型格式。目前兼容 CPU 和 GPU,可优化 Arm、x86、CUDA 和 riscv-vector,并支持移动设备部署。InferLLM 引入了专有 KVstorage 类型以简化缓存和管理,适合多种应用场景。最新支持的模型包括 LLama-2-7B、ChatGLM、Alpaca 等。
1
1
相关文章
InferLLM: 轻量级大语言模型推理框架
2024年08月30日
InferLLM学习资料汇总 - 轻量级LLM模型推理框架
2024年09月10日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号