#监控工具
jetson_stats: NVIDIA Jetson系列的强大监控和控制工具
uptime-kuma
Uptime Kuma是一款开源的自托管监控工具,支持多种监控方式,包括HTTP(s)、TCP和Ping等。该工具提供实时通知、多语言界面和状态页面等功能,操作界面直观快速。支持Docker和非Docker安装,适合个人及小型团队使用。项目在GitHub上持续更新,受到广泛关注。
amazon-documentdb-tools
amazon-documentdb-tools是一套专为Amazon DocumentDB设计的工具集,包含索引迁移、兼容性检查和全球集群自动化等功能。这些工具有助于简化MongoDB到DocumentDB的迁移过程,优化数据库性能,并支持灾难恢复和业务连续性规划。通过提供全面的数据库管理解决方案,amazon-documentdb-tools能够显著提升数据库运维效率。
jetson_stats
jetson-stats是一款为NVIDIA Jetson系列设备开发的监控和管理工具。它可以解析硬件架构信息,实时监控CPU、GPU、内存和风扇等关键指标,并支持NVP模型和jetson_clocks控制。这个工具不仅可以集成到Python脚本中,还支持Docker容器化部署,使用时无需超级用户权限。jetson-stats与所有NVIDIA Jetpack版本兼容,通过jtop界面提供了直观的设备监控和管理功能。
opslane
Opslane是一个开源的DevOps告警管理工具,通过机器学习技术将告警分类为可操作和噪音。它集成Slack,提供上下文信息和分析报告,帮助团队更有效地处理告警。该工具支持社区贡献,旨在提高告警管理效率,减轻运维团队的压力。
easeprobe
EaseProbe是一个用Go语言开发的开源监控工具,专注于服务健康状态检查。它支持HTTP、TCP、Ping等多种探测方式,可监控各类服务和系统。该工具提供Slack、Discord等多种通知渠道,并具备SLA报告和Prometheus指标输出功能。EaseProbe配置简单,部署灵活,适合各种规模的IT环境使用。
telegraf
Telegraf是一款开源的数据收集和监控代理工具,具有强大的扩展性。它提供超过300个插件,覆盖系统监控、云服务和消息传递等多个领域。Telegraf支持自定义代码集成,可编译为独立的静态二进制文件,并使用TOML进行配置。该项目拥有活跃的社区,有1200多名贡献者参与开发。Telegraf为用户提供了丰富的插件选择,包括设备、日志、消息、监控、网络和系统监控等方面。
HouseWatch
HouseWatch是专为ClickHouse集群开发的开源监控管理工具。它提供集群负载和性能概览、查询分析、日志搜索功能,支持监控和终止运行中的查询,分析磁盘使用情况,并具备直观的查询界面。该工具还能进行后台操作管理,自动回滚失败操作,有助于ClickHouse用户优化集群性能和解决问题。
Nagios-Plugins
这是一个包含大量高级监控插件的开源项目,为IT基础设施提供全面监控能力。项目支持多种操作系统和容器环境,涵盖众多技术和服务的检查脚本。通过持续更新和社区贡献,结合多平台CI/CD测试,确保了插件的质量和可靠性。适用于系统管理员和开发人员构建强大的监控系统。
dry
dry是一款开源的终端应用程序,用于管理Docker和Docker Swarm。它展示容器、镜像和网络信息,支持Swarm集群的节点、服务和堆栈管理。dry可连接本地和远程Docker守护进程,提供类似Docker CLI的命令功能,并可监控容器。作为单一二进制文件,dry安装简单,无需外部依赖。