#生产环境

HAL-9100学习资料汇总 - 边缘计算全栈LLM平台

2 个月前

HAL-9100 OpenAI SDK AI助手私有部署生产环境 Github 开源项目

2 个月前

BentoML学习资源汇总 - 构建高效可靠的AI服务系统

2 个月前

BentoML 模型服务框架 AI模型 Docker容器生产环境 Github 开源项目

2 个月前

设计机器学习系统:Chip Huyen的全面指南

3 个月前

机器学习系统设计生产环境 MLOps Chip Huyen Github 开源项目

3 个月前

ScaleLLM: 高性能推理系统助力大型语言模型部署

3 个月前

ScaleLLM 大模型推理高效性能生产环境集成开发 Github 开源项目

3 个月前

BentoML: 构建和扩展复合AI系统的统一框架

3 个月前

BentoML 模型服务框架 AI模型 Docker容器生产环境 Github 开源项目

3 个月前

相关项目

BentoML

BentoML是一个开源模型服务框架，简化了AI和ML模型的生产部署。可以将任何模型推理脚本轻松转化为REST API服务器，并通过简单配置文件管理环境、依赖和模型版本。BentoML支持高性能推理API的构建，利用动态批处理、模型并行化和多阶段流水线等优化功能，最大化CPU/GPU利用率。此外，还支持自定义AI应用、异步推理任务和定制化前后处理逻辑。通过Docker容器或BentoCloud可轻松部署至生产环境，适用于各种机器学习框架和推理运行时。

ScaleLLM

ScaleLLM是一个为大语言模型（LLMs）设计的高效推理系统，适用于生产环境。支持Llama3.1、Gemma2、Bloom、GPT-NeoX等多种开源模型，集成了CUDA图、前缀缓存、分块填充和推测解码等高级功能。项目正在积极开发，目标是提高效率并加入更多特性。现已上架PyPI，可通过pip安装。ScaleLLM还提供兼容OpenAI的REST API和本地聊天机器人UI，支持离线批量推理和在线分布式推理。

GeniA

GeniA是一个开源AI平台助手，能够在生产环境中执行多种任务。结合最新的行业最佳实践，GeniA快速适应团队需求，并在Slack频道内提供支持。从部署、故障排除到资源优化和安全检查，GeniA助力团队更快前行。

hal-9100

HAL-9100使用OpenAI SDK构建无需联网的AI助手，适用于生产环境。项目提供100%隐私保护，成本降低75%，速度提升23倍，支持多种文件格式和外部API请求。适合数据敏感领域如医疗、物联网和军事，专注于Software 3.0，通过最少硬编码提升灵活性，支持多种开源大型语言模型。了解更多关于代码解释器、知识检索和函数调用功能，快速开始构建定制AI解决方案。

arthas

Arthas是阿里巴巴开源的Java诊断工具，帮助开发者在生产环境中无需修改代码和重启服务器即可解决问题。其功能包括查看类加载情况、反编译、类加载器统计、方法调用详情、堆栈跟踪、方法统计和系统指标监控等。支持JDK 6以上版本，兼容Linux、Mac和Windows操作系统，并通过命令行、telnet和websocket进行本地和远程诊断。

jsbenchmark

jsbenchmark是一个JavaScript性能测试框架，为开发者提供评估和比较代码执行效率的平台。它具有直观的界面和详细的性能报告功能，有助于识别代码瓶颈和优化性能。这个工具适用于各级水平的JavaScript开发者，旨在提升代码效率。

dmls-book

本书介绍了设计可靠、可扩展和易维护的机器学习系统的全面方法。内容涵盖数据工程、指标选择、模型部署、监控和自动化流程，同时探讨了负责任AI的重要性。适合工程师、数据科学家和技术领导者阅读，帮助他们在实际问题中应用机器学习技术。

nodebestpractices

该项目收录100余条Node.js最佳实践,内容全面涵盖项目架构、错误处理、代码风格、测试、部署和安全等核心领域。由行业专家持续更新维护,提供详细说明和代码示例,适合不同水平的开发者学习参考,有助于构建高质量、安全可靠的Node.js应用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com