#AI模型部署

MindsDB入门学习资料 - 构建企业级AI应用的开源平台

2 个月前
Cover of MindsDB入门学习资料 - 构建企业级AI应用的开源平台

RKNN-LLM:瑞芯微AI芯片上的大语言模型部署解决方案

3 个月前
Cover of RKNN-LLM:瑞芯微AI芯片上的大语言模型部署解决方案

FastDeploy: 高效易用的深度学习模型部署工具包

3 个月前
Cover of FastDeploy: 高效易用的深度学习模型部署工具包
相关项目
Project Cover

mindsdb

MindsDB是一款基于企业数据构建AI的平台,支持从数据库、向量存储和应用程序数据中创建、服务和实时优化模型。该平台与众多数据源和流行的AI/ML框架集成,简化了数据和AI的连接过程,实现了AI系统的直观部署。用户还可以通过SQL和REST API等多种方式与MindsDB交互,从而在实时业务场景中部署AI/ML模型,提高企业运营效率和决策质量。

Project Cover

FastDeploy

高性能AI模型部署工具,支持文本、视觉、语音及跨模态模型的优化,适用于云端、移动端和边缘设备。支持160多种模型,涵盖图像分类、目标检测、OCR、人脸检测、抠图、跟踪、NLP、语音合成等任务,满足多场景、多硬件、多平台的需求。

Project Cover

rknn-llm

rknn-llm是瑞芯微芯片专用的大语言模型部署软件栈,包含模型转换工具RKLLM-Toolkit、运行时库RKLLM Runtime和RKNPU内核驱动。支持RK3588和RK3576系列平台,兼容TinyLLAMA、Qwen、Phi、ChatGLM3等多种主流大语言模型。该项目注重性能优化和量化精度提升,持续增加新功能,为开发者提供高效的AI模型部署方案。

Project Cover

LitServe

LitServe是一个基于FastAPI构建的AI模型部署引擎,具有高吞吐量和可扩展性。它提供批处理、流式传输和GPU自动扩展功能,支持多模态和多框架,适用于嵌入、LLM服务、音频处理等多种AI任务。基准测试显示,LitServe在并发请求处理方面表现优于FastAPI和TorchServe。该引擎还提供完全控制权和内置认证功能,无需为每个模型重新构建服务器。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号