热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#rtp-llm
rtp-llm学习资料汇总 - 阿里巴巴高性能LLM推理引擎
1 个月前
本文汇总了rtp-llm项目的各类学习资源,包括官方文档、教程、示例代码等,帮助开发者快速上手这个高性能的LLM推理框架。
rtp-llm
大语言模型
CUDA
量化
多模态输入
Github
开源项目
1 个月前
RTP-LLM: 阿里巴巴的高性能大语言模型推理引擎
2 个月前
探索阿里巴巴开源的RTP-LLM项目,一个为多样化应用场景设计的高性能大语言模型推理加速引擎。
rtp-llm
大语言模型
CUDA
量化
多模态输入
Github
开源项目
2 个月前
相关项目
rtp-llm
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号