热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#DashInfer
dash-infer - 面向x86和ARMv9的高性能大语言模型推理引擎
DashInfer
LLM推理
CPU优化
模型量化
高性能计算
Github
开源项目
DashInfer是一款针对x86和ARMv9硬件架构优化的C++推理引擎,支持连续批处理和NUMA感知功能。该引擎可充分发挥现代服务器CPU性能,支持推理参数规模达14B的大语言模型。DashInfer采用轻量架构,提供高精度推理和标准LLM推理技术,兼容主流开源大语言模型,并集成了量化加速和优化计算内核等功能。
1
1
相关文章
DashInfer: 高性能原生LLM推理引擎
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号