Apache DolphinScheduler
关于
Apache DolphinScheduler 是一个现代数据编排平台。它能够敏捷地使用低代码创建高性能工作流。它还提供了强大的用户界面,致力于解决数据管道中复杂的任务依赖关系,并提供各种开箱即用的作业类型。
DolphinScheduler 的主要特点如下:
- 易于部署,提供四种部署方式,包括单机、集群、Docker 和 Kubernetes。
- 易于使用,可以通过四种方式创建和管理工作流,包括 Web UI、Python SDK、Yaml 文件和开放 API。
- 高度可靠和高可用性,采用多主多工分布式架构,原生支持水平扩展。
- 高性能,其性能比其他编排平台快 N 倍,每天可支持数千万个任务。
- 云原生,DolphinScheduler 支持编排多云/数据中心工作流,并支持自定义任务类型。
- 对工作流和工作流实例(包括任务)进行版本控制。
- 对工作流和任务的各种状态控制,支持随时暂停/停止/恢复它们。
- 多租户支持。
- 其他功能如回填支持(Web UI 原生)、权限控制(包括项目、资源和数据源)。
快速开始
- 快速体验
- 想要以单机模式开始
- 想要以 Docker 开始
- 对于 Kubernetes
- 对于 Terraform
用户界面截图
-
主页: 项目和工作流概览,包括最新的工作流实例和任务实例状态统计。
-
工作流定义: 通过拖放创建和管理工作流,轻松构建和维护复杂工作流,开箱即用支持大量任务。
-
工作流树视图: 抽象树结构可以更清晰地理解任务之间的关系。
-
数据源: 管理支持多种外部数据源,为 MySQL、PostgreSQL、Hive、Trino 等提供统一的数据访问能力。
-
监控: 实时查看主服务器、工作节点和数据库的状态,包括服务器资源使用和负载,无需登录服务器即可快速进行健康检查。
建议和错误报告
请遵循此指南报告您的建议或错误。
贡献
社区欢迎每个人贡献,请参阅此页面了解更多信息:如何贡献, 如果您是 DolphinScheduler 新手,可以在这里找到适合初学者的问题。
社区
欢迎加入 Apache DolphinScheduler 社区:
- 加入 DolphinScheduler Slack 与社区保持联系
- 关注 DolphinScheduler Twitter 获取最新消息
- 订阅 DolphinScheduler 邮件列表,users@dolphinscheduler.apache.org 用于用户,dev@dolphinscheduler.apache.org 用于开发者
生态系统
DolphinScheduler 丰富了 CNCF 云原生景观。