#多模型兼容

InferLLM学习资料汇总 - 轻量级LLM模型推理框架

2 个月前

InferLLM llama.cpp 模型推理高效率多模型兼容 Github 开源项目

2 个月前

InferLLM: 轻量级大语言模型推理框架

3 个月前

InferLLM llama.cpp 模型推理高效率多模型兼容 Github 开源项目

3 个月前

相关项目

InferLLM

InferLLM 是一个高效简洁的语言模型推理框架，源于 llama.cpp 项目。主要特点包括结构简单、高性能、易于上手，并支持多模型格式。目前兼容 CPU 和 GPU，可优化 Arm、x86、CUDA 和 riscv-vector，并支持移动设备部署。InferLLM 引入了专有 KVstorage 类型以简化缓存和管理，适合多种应用场景。最新支持的模型包括 LLama-2-7B、ChatGLM、Alpaca 等。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com