一个框架用于🧑💻 开发 ▶️ 部署 和 📊 运营
使用 Python 和 SQL 的数据工作流
VDK SDK 简介
开始使用 VDK SDK: ➡ 安装 Quickstart VDK。唯一要求是 Python 3.7+。
➡ 如果您迫不及待想快速开始,请开发您的第一个数据作业。 |
数据摄取
摄取示例: ➡ 将REST API数据摄取到数据库➡ 将数据库数据摄取到数据库 ➡ 将本地CSV文件摄取到数据库 ➡ 使用作业属性进行增量摄取 |
数据转换
开始转换数据: ➡ 数据建模:将数据视为产品➡ 使用SQL和本地数据库处理数据 ➡ 使用Kimball仓库模板处理数据 |
数据作业部署(构建、部署、发布)
VDK 控制服务提供 REST API,供用户在 Kubernetes 运行环境中创建、部署、管理和执行数据作业。
开始在控制服务中部署作业: ➡ 使用 vdk server --install 安装本地控制服务➡ 安排数据作业自动执行 ➡ 使用 VDK DAG 编排数据作业 |
运维和监控
开始运维和监控数据作业: ➡ Versatile Data Kit UI - 安装和入门➡ VDK 运维用户界面 - Versatile Data Kit |
乐高式可扩展性
开始使用一些VDK插件: ➡ 浏览可用插件➡ 值得关注的插件: 使用vdk-lineage跟踪作业血缘关系 使用vdk-csv导入/摄取或导出CSV文件 ➡ 编写自己的插件 |
支持与贡献
如需支持,您可以加入我们的Slack频道,在GitHub上创建问题或拉取请求以提交建议或更改。
如果您有兴趣作为开发者贡献,请访问贡献页面。
联系方式
- 在Slack上与我们交流:
☝️ 加入CNCF Slack工作区。
✌️ 加入#versatile-data-kit频道。 - 参加下一次社区会议
- 在Twitter上关注我们。
- 订阅Versatile Data Kit YouTube频道。
- 加入我们的开发邮件列表,供VDK开发者和维护者使用。
行为准则
参与项目源代码工作或在任何问题跟踪器、Slack频道和邮件列表中互动的每个人都应熟悉并遵守行为准则。