#GPU自动缩放

LitServe - 基于FastAPI的高性能AI模型部署引擎支持批处理和GPU自动扩展

LitServeAI模型部署高性能服务FastAPIGPU自动缩放Github开源项目

LitServe是一个基于FastAPI构建的AI模型部署引擎，具有高吞吐量和可扩展性。它提供批处理、流式传输和GPU自动扩展功能，支持多模态和多框架，适用于嵌入、LLM服务、音频处理等多种AI任务。基准测试显示，LitServe在并发请求处理方面表现优于FastAPI和TorchServe。该引擎还提供完全控制权和内置认证功能，无需为每个模型重新构建服务器。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号