什么是HolmesGPT?
HolmesGPT是一款开源的AI驱动DevOps助手,由Robusta开发。它能够像人类工程师一样,通过查看警报并获取缺失数据来调查事件,直到找出根本原因。HolmesGPT支持OpenAI、Azure AI、AWS Bedrock等多种LLM模型。
HolmesGPT的主要功能
- 调查事件(AIOps):可以调查来自PagerDuty/OpsGenie/Prometheus/Jira等系统的告警
- 双向集成:可以在现有的工单/事件管理系统中查看调查结果
- 自动分类:作为第一响应者,标记关键告警并为团队优先处理
- 告警丰富:自动为告警添加上下文信息,如日志和微服务健康状况,以更快找到根本原因
- 识别云问题:可以询问HolmesGPT有关不健康基础设施的问题
- 用普通英语实现Runbook自动化:根据提供的runbook自动调查已知问题,加快响应速度
快速开始
- 安装HolmesGPT:
brew tap robusta-dev/homebrew-holmesgpt
brew install holmesgpt
-
获取支持的LLM API密钥(如OpenAI API密钥)
-
运行HolmesGPT:
holmes ask "我的集群中有什么问题?"
学习资源
- GitHub仓库 - 包含完整的源代码和文档
- YouTube演示视频
- Robusta官方文档 - 详细的配置和使用说明
自定义和扩展
HolmesGPT提供了多种扩展点:
- 自定义工具 - 使用
-t
参数加载自定义工具集文件 - 自定义Runbook - 使用
-r
参数加载自定义Runbook文件 - 修改默认提示词 - 默认提示词位于./holmes/plugins/prompts目录
社区支持
如有任何问题,欢迎在Robusta Slack社区中提问。
HolmesGPT是一个强大而灵活的DevOps助手,通过学习和使用它,可以大大提高运维效率。希望这份学习资料汇总能帮助你快速上手HolmesGPT!