#Kubernetes

k8sgpt - 扫描 Kubernetes 集群、诊断和用简单英语分类问题的工具
Github开源项目KubernetesAI集成安装指南k8sgpt诊断工具
k8sgpt是一个专为Kubernetes集群设计的AI工具,能够扫描、诊断和排查问题,并提供深度分析。整合了SRE经验,k8sgpt可以提取最相关的信息并进行AI解释,支持OpenAI、Azure、Cohere等多种AI提供商和本地模型。该工具支持多种安装方式,包括brew、rpm和deb,适用于Linux、Mac和Windows系统。其集成模式适合集群持续监控,可与Prometheus和Alertmanager等系统无缝结合。
pai - 兼容多种AI框架与硬件的开源AI平台
Github开源项目深度学习KubernetesMicrosoftAI平台OpenPAI
OpenPAI是一个共享AI计算资源的开源平台,支持本地、混合和公共云部署,兼容多种AI框架和硬件。平台通过模块化设计和用户友好的体验,提供从训练到部署的完整解决方案,适合深度学习任务。OpenPAI支持分布式训练、虚拟集群管理,并提供丰富的扩展和定制功能。
kong - 高性能、可扩展的跨平台API网关
Github开源项目Kong API Gateway插件云原生API认证Kubernetes热门
Kong API Gateway是一个云原生、平台无关的API网关,以其高性能和通过插件进行扩展的能力而著称。支持代理、路由、负载均衡、健康检查、鉴权等功能,使其成为微服务或传统API流量的中心协调层。此外,Kong在Kubernetes上原生运行,提供官方的Kubernetes Ingress Controller。
sqlflow - 机器学习与SQL编程的先进集成
Github开源项目KubernetesTensorFlow机器学习SQLFlowXGBoost热门
SQLFlow 是一款编译器,它将SQL程序编译成在Kubernetes上运行的工作流,支持包括机器学习训练、预测、模型评估等在内的AI作业。此平台支持MySQL、TiDB、Hive等多种数据库系统,以及TensorFlow、Keras、XGBoost等机器学习工具包。SQLFlow 致力于通过SQL增强机器学习模型开发,让拥有SQL技能的工程师也能轻松开发高级机器学习应用。
training-operator - Kubernetes原生的分布式机器学习训练解决方案
Github开源项目Kubernetes分布式训练机器学习KubeflowTraining Operator
Kubeflow Training Operator是一个Kubernetes原生工具,支持PyTorch、TensorFlow等多种框架的分布式训练。用户可以通过Kubernetes自定义资源API或Python SDK轻松部署和管理大规模机器学习模型的训练任务。项目还提供全面的监控设计和社区支持,是优化模型训练流程的理想工具。
kubectl-ai - 全自动的Kubernetes配置生成及应用插件
Github开源项目OpenAI插件Kubernetes部署kubectl-ai
kubectl-ai,一款集成了OpenAI GPT的Kubectl插件,能够自动创建和应用Kubernetes配置。它简化了配置的管理,支持Azure OpenAI、本地API等多种配置环境,提升部署的灵活性与准确度。
langstream - LangStream开源项目:支持云端和本地开发的多功能工具及示例应用
Github开源项目Kubernetes部署LangStreamCLI开发
LangStream开源项目提供多功能开发工具和示例应用,通过CLI或Kubernetes集群运行和部署。提供多种安装方式及详细文档和支持,适用于MacOS和Unix系统。项目集成OpenAI,用户能快速创建和管理应用。支持通过Helm图表进行生产级部署,并兼容EKS、AKS、GKE等主流云服务提供商的Kubernetes集群,同时提供minikube本地部署解决方案,用于快速测试和开发。
aikit - 简化部署和优化大型语言模型的平台
Github开源项目OpenAI APIKubernetesLocalAIDockerAIKit
AIKit是一个全方位平台,专为快速部署、构建和微调大型语言模型(LLM)而设计。它支持OpenAI API兼容的推理和灵活的微调接口,无需GPU即可使用。AIKit还支持多模式模型、图像生成、多平台CPU和GPU加速推理以及Kubernetes部署,简化了开发流程并确保供应链安全,适用于各种环境。
code-act - 使用可执行代码统一LLM代理机制
Github开源项目PythonKubernetesLLMCodeActCodeActAgent
CodeAct通过可执行代码统一了LLM代理的行动空间,并利用集成的Python解释器实现动态行为调整。相比文本和JSON,CodeAct成功率提高了20%。项目包含详细数据集和模型说明,并支持Kubernetes部署,显著提升在非专业任务中的性能表现。
leapfrogai - 自托管AI平台,适用于隔离网络和资源受限环境
Github开源项目自托管Kubernetes大语言模型AI平台LeapfrogAI
LeapfrogAI是一个自托管AI平台,设计用于隔离网络和资源受限环境。它提供了向量数据库、模型后端、API和用户界面等功能,使用户能够在保持数据独立性和成本效益的同时,定制化地实施AI技术。支持多种后端以及Kubernetes和Zarf部署方式,广泛适用于各种应用场景。
kopilot - Kubernetes工作负载与安全审计的AI解决方案
Github开源项目Kubernetes诊断Kopilot审计安全配置
Kopilot可以诊断Kubernetes集群中的不健康工作负载并提供原因分析,同时审计资源以发现安全配置问题。支持在macOS、Linux等多种操作系统上安装,通过设置环境变量即可运行,轻松执行诊断和审计任务,并将支持更多AI服务。
k8sgpt-operator - 在Kubernetes中实现灵活的工作负载管理
Github开源项目Kubernetes监控安装K8sGPThelm
该Operator使K8sGPT可在Kubernetes集群中集成与管理。用户可自定义资源以定义K8sGPT工作负载的行为与范围,支持多集群监控及多种AI后端集成,如OpenAI、AzureOpenAI和Amazon Bedrock。配置和输出分析结果可以灵活调整,方便集成到现有工作流中。
blazork8s - Kubernetes管理工具,集成ChatGPT,支持多语言和高度模块化
Github开源项目ChatGPTKubernetesC#BlazorBlazor k8s
一个使用C# Blazor编写的Kubernetes管理工具,集成ChatGPT模型,提供用户友好的界面,适合初学者使用。功能包括直观显示Kubernetes资源、树状结构展示和文档说明、详细的资源字段解释、官方文档链接、示例浏览、YAML资源高效编辑、动态资源使用展示、高频命令执行、集群资源检查、支持多语言和API集成。通过拓扑图展示工作负载关系及状态,支持GatewayAPI可视化。用户可以通过简单命令在本地或Kubernetes集群中轻松部署和运行。
distributed-ml-patterns - 构建并优化分布式机器学习系统的方法
Github开源项目KubernetesKubeflow分布式机器学习Distributed Machine Learning PatternsArgo Workflows
《Distributed Machine Learning Patterns》一书详细介绍了如何构建可扩展和高可靠性的机器学习系统。内容涵盖数据摄取、分布式训练、模型服务等方面,以及如何利用Kubernetes、TensorFlow、Kubeflow和Argo Workflows实现任务自动化。通过该书,读者将掌握关键概念与实际案例,并学会在大规模集群上管理和监控机器学习任务。本书适合具备基础机器学习知识的数据分析师、数据科学家和软件工程师。
sematic - 开源的机器学习平台,支持ML工程师和数据科学家使用Python编写并运行复杂的端到端流水线
Github开源项目Python开源Kubernetes机器学习Sematic
Sematic是一个开源的机器学习平台,支持ML工程师和数据科学家使用Python编写并运行复杂的端到端流水线。无论在本地计算机、云虚拟机还是Kubernetes集群上执行,Sematic都可以高效利用云资源。它具有易于上手、端到端可追溯性、本地与云一致性和高可重复性等特点,可在无需部署或额外基础设施的情况下开始使用,所有流水线步骤都可以在web仪表盘上监控和可视化,适用于优化不同计算资源。
mpi-operator - 在Kubernetes上简化Allreduce式分布式训练的操作
Github开源项目Kubernetes分布式训练安装指南KubeflowMPI Operator
MPI Operator简化了在Kubernetes上运行Allreduce风格分布式训练的操作,并无缝集成到Kubeflow环境中。用户可通过简单的kubectl命令部署最新版本,并通过配置文件定义和创建MPI Job。该项目支持多节点TensorFlow训练,提供日志监控和训练进度查看功能。此外,MPI Operator与Kube-state-metrics集成,全面支持Docker镜像构建和推送。了解更多安装步骤、使用案例和贡献指南,请访问项目主页。
katana-skipper - 机器学习工作流引擎
Github开源项目Kubernetes机器学习Docker微服务Katana ML Skipper
Katana-skipper 是一个灵活的机器学习工作流引擎,它能够在多个微服务之间进行事件调度,并创建可执行的流程来处理请求。该引擎可配置以支持任何微服务,且具有通用的引擎和通信部分。示例服务使用波士顿房价数据进行数据处理和模型训练,支持多种编程语言的微服务容器,包括 Python 和 JavaScript。Skipper 可部署于任何支持 Kubernetes 或 Docker 的云服务商,并支持使用 Kubernetes 命令进行扩展。
loggie - 云原生的轻量级日志采集和处理工具
Github开源项目KubernetesGolang数据传输Loggie日志收集
Loggie是一个基于Golang实现的轻量级、高性能的云原生日志代理和聚合器。它支持多种管道和可插拔组件,如数据传输、过滤、解析和告警,通过Kubernetes原生CRD进行操作和管理,提供生产环境下的可观测性、可靠性和自动化功能。Loggie可以构建可扩展的云原生日志数据平台,具备高性能、自适应并发、实时解析与转换以及日志聚合和监控功能,适用于多种架构部署,实现全面的日志数据采集与处理。
kserve - 跨平台机器学习模型服务,提供高效扩展性强的推理功能
Github开源项目KubernetesKServe机学习模型部署模型推理平台高可扩展性
KServe 提供 Kubernetes 自定义资源定义,支持多种机器学习框架,使用标准化推理协议进行预测和生成模型服务。它简化了自动扩展、网络配置和健康检查的复杂性,支持 GPU 自动扩展、零容量和金丝雀部署等高级功能,适用于生产级的机器学习服务,涵盖预处理、后处理和可解释性。更多信息请访问官网。
kubeflow - 简单、可移植且可扩展的Kubernetes上的AI/ML平台
Github开源项目AIKubernetes机器学习Kubeflow
Kubeflow项目专注于在Kubernetes上简化、可移植且可扩展的AI/ML解决方案。它包含多个开源组件,支持机器学习生命周期的各个阶段,如模型服务、实验管理和数据流水线等。提供丰富的官方文档和社区支持,用户可以通过GitHub获取详细信息和技术支持,这是构建AI/ML应用的理想工具。
arena - 帮助数据科学家简化机器学习训练作业的运行和监控的命令行工具
Github开源项目Kubernetes命令行界面Arena机器学习训练GPU资源管理
Arena 是一个命令行工具,帮助数据科学家简化机器学习训练作业的运行和监控。支持独立和分布式的TensorFlow训练,基于Kubernetes、Helm和Kubeflow,降低数据科学家对Kubernetes知识的依赖。此外,Arena 提供 `top` 命令可检查 Kubernetes 集群中的 GPU 资源,让数据科学家在单一机器上享受 GPU 集群的强大性能。
elasticdl - Kubernetes原生深度学习框架,支持弹性调度和容错
Github开源项目PyTorch深度学习KubernetesTensorFlowElasticDL
ElasticDL是一个Kubernetes原生的深度学习框架,提供故障容错和弹性调度功能。通过Kubernetes的原生设计,ElasticDL能够实现故障恢复,并与其优先权抢占机制协同工作,提高集群整体利用率。框架支持TensorFlow和PyTorch,界面简洁,用户可通过命令行进行分布式训练。无论在本地、内部集群还是公有云,ElasticDL都能快速启动深度学习任务。
monday - 微服务开发CLI工具,支持本地应用管理与Kubernetes远程端口转发
Github开源项目KubernetesMonday本地应用端口转发自动重载
这款CLI工具提供统一的应用配置管理,支持Go、NodeJS、Rust等本地应用的热重载。通过Kubernetes或SSH进行远程端口转发,将应用流量本地化,并自动重连丢失的连接。该工具支持多次转发同一端口和监控本地及远程应用,可显著提升开发效率。多种安装方式,包括Homebrew和二进制下载,配置灵活且简便,适合多项目环境。
Kubernetes-and-Cloud-Native-Associate-KCNA - KCNA认证全面指南:Kubernetes基础与云原生技术
Github开源项目云原生KubernetesKCNA容器编排认证考试
KCNA认证指南详解Kubernetes基础、容器编排、云原生架构等核心内容,提供完整备考资料与实践题目,全面提升云原生技术水平。
cloudnative-pg - 为Kubernetes设计的PostgreSQL管理系统
Github开源项目PostgreSQLKubernetes开源平台数据库管理CloudNativePG
CloudNativePG是一个开源平台,为Kubernetes环境中的PostgreSQL数据库管理提供全面解决方案。该平台覆盖数据库的全生命周期,从部署到日常维护。其核心组件CloudNativePG operator采用Kubernetes原生方法,通过扩展控制器实现高可用PostgreSQL集群的管理。平台功能包括自动故障转移、副本扩展和滚动更新,所有复杂操作均通过Kubernetes API服务器协调完成。
stern - Kubernetes多容器日志实时跟踪工具
Github开源项目KubernetesStern日志容器多pod
Stern是一款Kubernetes日志跟踪工具,支持同时监控多个Pod和容器的日志流。它可通过正则表达式匹配Pod名称,自动追踪新Pod,并对不同容器日志进行着色。Stern提供多样化的命令行选项,包括自定义输出模板、跨命名空间查看和交互式选择等功能。作为kubectl logs的替代工具,Stern简化了Kubernetes环境中的日志查看和问题排查流程。
kaito - Kubernetes集群AI/ML模型自动化部署与管理工具
Github开源项目AIKubernetes自动化GPU大型模型
Kaito是一款专为Kubernetes集群设计的AI/ML模型自动化管理工具。它支持falcon和phi-3等开源大模型,通过容器镜像管理模型文件,提供预设配置,自动配置GPU节点,并利用Microsoft Container Registry托管模型镜像。Kaito显著简化了在Kubernetes环境中部署和管理大型AI推理模型的过程,为开发者和运维人员提供了高效、便捷的解决方案。
kubernetes-examples - Kubernetes配置和部署示例代码库
Github开源项目云原生KubernetesDevOps示例代码容器编排
kubernetes-examples是一个Kubernetes示例代码库,提供多种配置和部署案例。项目涵盖基础到高级应用场景,帮助开发者和运维人员学习Kubernetes功能,促进容器化应用的开发和部署。
kuboard-press - 集群管理的开源图形化界面
Github开源项目Kubernetes微服务容器编排Kuboard集群管理
Kuboard是一个开源的Kubernetes管理界面,支持1.13及以上版本。它具备多集群管理、权限控制、监控和日志聚合等功能,并支持多种认证方式和存储类型。Kuboard通过微服务分层展示和图形化编辑简化了Kubernetes管理,同时提供丰富的互操作性和扩展性。该项目在GitHub上获得了超过10000颗星,已被1000多家企业应用于生产环境。
awesome-kubernetes - Kubernetes资源大全:从入门到精通的权威指南
Github开源项目云原生KubernetesDevOps微服务容器编排
这是一个全面的Kubernetes资源汇总,涵盖入门指南、高级技巧、教程、工具和最佳实践。项目由社区维护并持续更新,为开发者和运维人员学习使用Kubernetes提供权威参考。作为探索容器编排和云原生技术的理想起点,本列表包含丰富的学习材料和实用工具,助力用户掌握Kubernetes生态系统。
lens - Kubernetes开发管理利器 简化云原生工作流程
Github开源项目云原生KubernetesDevOpsIDELens
Lens是一款广受欢迎的Kubernetes集成开发环境,用户数量超过100万。该工具为开发人员和运维工程师提供直观界面,便于管理和诊断Kubernetes工作负载。Lens不仅有助于Kubernetes学习,还能提高团队效率,减少云原生开发所需工具。从初创公司到大型企业,众多团队选择使用Lens。其上下文感知界面简化了Kubernetes操作,成为云原生开发和运维的重要工具。
k9s - Kubernetes集群管理的终端用户界面工具
Github开源项目开源KubernetesCLI集群管理终端UI
K9s是一个为Kubernetes提供终端用户界面的集群管理工具。它实时监控集群变化,提供丰富的资源操作命令,简化了集群的导航、观察和管理流程。K9s支持多种安装方式,兼容主流操作系统,并允许自定义配置。作为开源项目,K9s为用户提供了直观高效的Kubernetes集群管理体验。
kubectl - Kubernetes官方命令行工具kubectl
Github开源项目Kubernetes命令行工具Kubectl客户端开发
这个仓库是kubectl的开发中心,用于跟踪问题并提供客户端程序包。kubectl作为Kubernetes的官方命令行工具,用于管理和操作集群。项目遵循严格的开发标准,包括全面的测试覆盖和Go语言规范。它独立于Kubernetes核心,欢迎社区贡献,并遵循项目的行为准则。
Reloader - Kubernetes配置变更自动监控与更新工具
Github开源项目Kubernetes配置管理容器编排Reloader自动重启
Reloader实现了Kubernetes配置变更的自动监控和更新。它可检测ConfigMap和Secret的修改,并触发相关Deployment、DaemonSet等资源的滚动更新。通过注解实现灵活配置,支持多种更新策略,适用于Kubernetes 1.19及更高版本。Reloader简化了配置管理流程,提高了应用的可维护性和稳定性。
kubectx - 简化Kubernetes集群和命名空间管理的命令行工具
Github开源项目Kubernetes命令行工具kubectlkubectxkubens
kubectx和kubens是用于管理Kubernetes集群上下文和命名空间的命令行工具。它们提供交互式模式、自动补全和颜色定制功能,提升kubectl使用效率。这两个工具支持多平台安装,兼容常见包管理器。kubectx和kubens简化了在不同Kubernetes环境间的切换操作,适用于需要频繁更改集群或命名空间的开发和运维工作。
kubesphere - 一个用于云原生应用管理的分布式操作系统和多租户容器平台
Github开源项目云原生KubernetesKubeSphereDevOps多云管理
KubeSphere是以Kubernetes为核心的分布式操作系统,支持多云、多集群和边缘计算的统一管理。其插拔式架构允许无缝集成第三方应用,提供全栈自动化运维和DevOps工作流。平台具备直观的Web UI,帮助企业构建功能丰富的多租户容器平台,覆盖Kubernetes多集群管理、云原生可观测性、服务网格和边缘计算等关键功能。最新的v3.4.0版本进一步提升了用户体验,并带来了多项功能更新。