热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GPU自动缩放
LitServe - 基于FastAPI的高性能AI模型部署引擎 支持批处理和GPU自动扩展
LitServe
AI模型部署
高性能服务
FastAPI
GPU自动缩放
Github
开源项目
LitServe是一个基于FastAPI构建的AI模型部署引擎,具有高吞吐量和可扩展性。它提供批处理、流式传输和GPU自动扩展功能,支持多模态和多框架,适用于嵌入、LLM服务、音频处理等多种AI任务。基准测试显示,LitServe在并发请求处理方面表现优于FastAPI和TorchServe。该引擎还提供完全控制权和内置认证功能,无需为每个模型重新构建服务器。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号