热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#混合CPU/GPU使用
PowerInfer - 消费级GPU上大型语言模型高效推理引擎
PowerInfer
大语言模型
GPU加速
混合CPU/GPU使用
局部性设计
Github
开源项目
PowerInfer是一款在个人电脑上针对消费级GPU设计的高效大型语言模型(LLM)推理引擎。它结合激活局部性原理和CPU/GPU混合技术,通过优化热/冷激活神经元的处理方式,显著提高推理速度并降低资源消耗。软件还融入了适应性预测器和神经元感知技术,优化了推理效率和精度,支持快速、低延迟的本地模型部署。
1
1
相关文章
PowerInfer: 消费级GPU上的高速大语言模型推理引擎
3 个月前
PowerInfer学习资料汇总 - 消费级GPU上的高速大语言模型推理引擎
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号