versatile-data-kit

全面的数据工作流开发、部署和运维框架

Versatile Data Kit 数据处理框架数据工作流 Python SQL Github 开源项目

Versatile Data Kit是一个综合性数据工作流框架,支持Python和SQL开发。它提供ETL/ELT模式和模块化扩展,简化了数据提取、转换和加载过程。该框架具备一键部署功能,并集成了运维监控工具。通过Control Service,可实现数据作业的便捷管理和调度。Versatile Data Kit致力于提高数据工程效率,适用于各类数据处理场景。

访问官网

Github

介绍相关项目

多功能数据工具包

一个框架用于🧑‍💻 开发 ▶️ 部署和 📊 运营
使用 Python 和 SQL 的数据工作流

🎯 编写更简短、更易读的代码。

🔄 现成可用的数据 ETL/ELT 模式。

🧩 乐高式可扩展性。

🚀 一键部署。

🛠 操作和监控。 ️

VDK SDK 简介

简化数据摄取和数据处理的框架。
使用 Python 或 SQL 编写任何代码。
使您能够运行数据作业的工具集。

开始使用 VDK SDK：

➡ 安装 Quickstart VDK。唯一要求是 Python 3.7+。

pip install quickstart-vdk
vdk --help

➡ 如果您迫不及待想快速开始，请开发您的第一个数据作业。

数据摄取

从各种来源（HTTP API、数据库、CSV等）提取数据。
通过最少的转换确保数据保真度。
将数据加载到您首选的目标（数据库、云存储）。

摄取示例：

➡ 将REST API数据摄取到数据库
➡ 将数据库数据摄取到数据库
➡ 将本地CSV文件摄取到数据库
➡ 使用作业属性进行增量摄取

数据转换

SQL和Python参数化转换。
可扩展的数据建模模板。
创建数据集或表作为产品。

开始转换数据：

➡ 数据建模：将数据视为产品
➡ 使用SQL和本地数据库处理数据
➡ 使用Kimball仓库模板处理数据

数据作业部署（构建、部署、发布）

VDK 控制服务提供 REST API，供用户在 Kubernetes 运行环境中创建、部署、管理和执行数据作业。

调度、打包、依赖管理、部署。
执行管理和监控。
源代码版本控制和跟踪。快速回滚。
使用属性和密钥管理状态和凭证。

开始在控制服务中部署作业：

➡ 使用 vdk server --install 安装本地控制服务
➡ 安排数据作业自动执行
➡ 使用 VDK DAG 编排数据作业

运维和监控

使用运维界面监控和排查生产环境中的数据工作负载。
数据作业部署或执行期间的错误通知。
通过将错误分类为用户错误或平台错误，将错误路由给正确的人员。

开始运维和监控数据作业：

➡ Versatile Data Kit UI - 安装和入门
➡ VDK 运维用户界面 - Versatile Data Kit

乐高式可扩展性

模块化：仅使用所需功能。可扩展：构建缺失功能。
使用pip轻松安装任何插件作为Python包。
用于增强数据处理、摄取、作业执行和命令行生命周期

开始使用一些VDK插件：

➡ 浏览可用插件
➡ 值得关注的插件：
使用vdk-lineage跟踪作业血缘关系
使用vdk-csv导入/摄取或导出CSV文件
➡ 编写自己的插件

支持与贡献

如需支持，您可以加入我们的Slack频道，在GitHub上创建问题或拉取请求以提交建议或更改。
如果您有兴趣作为开发者贡献，请访问贡献页面。

联系方式

在Slack上与我们交流：
☝️ 加入CNCF Slack工作区。
✌️ 加入#versatile-data-kit频道。
参加下一次社区会议
在Twitter上关注我们。
订阅Versatile Data Kit YouTube频道。
加入我们的开发邮件列表，供VDK开发者和维护者使用。

行为准则

参与项目源代码工作或在任何问题跟踪器、Slack频道和邮件列表中互动的每个人都应熟悉并遵守行为准则。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号