热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#rtp-llm
rtp-llm - 大型语言模型推理加速引擎
rtp-llm
大语言模型
CUDA
量化
多模态输入
Github
开源项目
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
1
1
相关文章
RTP-LLM: 阿里巴巴的高性能大语言模型推理引擎
2024年08月30日
rtp-llm学习资料汇总 - 阿里巴巴高性能LLM推理引擎
2024年09月10日
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号