#生产环境
BentoML
BentoML是一个开源模型服务框架,简化了AI和ML模型的生产部署。可以将任何模型推理脚本轻松转化为REST API服务器,并通过简单配置文件管理环境、依赖和模型版本。BentoML支持高性能推理API的构建,利用动态批处理、模型并行化和多阶段流水线等优化功能,最大化CPU/GPU利用率。此外,还支持自定义AI应用、异步推理任务和定制化前后处理逻辑。通过Docker容器或BentoCloud可轻松部署至生产环境,适用于各种机器学习框架和推理运行时。
ScaleLLM
ScaleLLM是一个为大语言模型(LLMs)设计的高效推理系统,适用于生产环境。支持Llama3.1、Gemma2、Bloom、GPT-NeoX等多种开源模型,集成了CUDA图、前缀缓存、分块填充和推测解码等高级功能。项目正在积极开发,目标是提高效率并加入更多特性。现已上架PyPI,可通过pip安装。ScaleLLM还提供兼容OpenAI的REST API和本地聊天机器人UI,支持离线批量推理和在线分布式推理。
GeniA
GeniA是一个开源AI平台助手,能够在生产环境中执行多种任务。结合最新的行业最佳实践,GeniA快速适应团队需求,并在Slack频道内提供支持。从部署、故障排除到资源优化和安全检查,GeniA助力团队更快前行。
hal-9100
HAL-9100使用OpenAI SDK构建无需联网的AI助手,适用于生产环境。项目提供100%隐私保护,成本降低75%,速度提升23倍,支持多种文件格式和外部API请求。适合数据敏感领域如医疗、物联网和军事,专注于Software 3.0,通过最少硬编码提升灵活性,支持多种开源大型语言模型。了解更多关于代码解释器、知识检索和函数调用功能,快速开始构建定制AI解决方案。
arthas
Arthas是阿里巴巴开源的Java诊断工具,帮助开发者在生产环境中无需修改代码和重启服务器即可解决问题。其功能包括查看类加载情况、反编译、类加载器统计、方法调用详情、堆栈跟踪、方法统计和系统指标监控等。支持JDK 6以上版本,兼容Linux、Mac和Windows操作系统,并通过命令行、telnet和websocket进行本地和远程诊断。
jsbenchmark
jsbenchmark是一个JavaScript性能测试框架,为开发者提供评估和比较代码执行效率的平台。它具有直观的界面和详细的性能报告功能,有助于识别代码瓶颈和优化性能。这个工具适用于各级水平的JavaScript开发者,旨在提升代码效率。
dmls-book
本书介绍了设计可靠、可扩展和易维护的机器学习系统的全面方法。内容涵盖数据工程、指标选择、模型部署、监控和自动化流程,同时探讨了负责任AI的重要性。适合工程师、数据科学家和技术领导者阅读,帮助他们在实际问题中应用机器学习技术。
nodebestpractices
该项目收录100余条Node.js最佳实践,内容全面涵盖项目架构、错误处理、代码风格、测试、部署和安全等核心领域。由行业专家持续更新维护,提供详细说明和代码示例,适合不同水平的开发者学习参考,有助于构建高质量、安全可靠的Node.js应用。