Project Icon

versatile-data-kit

全面的数据工作流开发、部署和运维框架

Versatile Data Kit是一个综合性数据工作流框架,支持Python和SQL开发。它提供ETL/ELT模式和模块化扩展,简化了数据提取、转换和加载过程。该框架具备一键部署功能,并集成了运维监控工具。通过Control Service,可实现数据作业的便捷管理和调度。Versatile Data Kit致力于提高数据工程效率,适用于各类数据处理场景。

多功能数据工具包 多功能数据工具包

最近活动 vdk-core 的月下载量 许可证 pre-commit 构建状态 推特 YouTube 频道订阅者


一个框架用于🧑‍💻 开发 ▶️ 部署 和 📊 运营
使用 Python 和 SQL 的数据工作流


🎯 编写更简短、更易读的代码。
🔄 现成可用的数据 ETL/ELT 模式。
🧩 乐高式可扩展性。

🚀 一键部署。
🛠 操作和监控。 ️

VDK SDK 简介 数据摄取 数据转换 作业部署 作业运营 可扩展性 支持与贡献

VDK SDK 简介

  • 简化数据摄取和数据处理的框架。
  • 使用 Python 或 SQL 编写任何代码。
  • 使您能够运行数据作业的工具集。

开始使用 VDK SDK:

安装 Quickstart VDK。唯一要求是 Python 3.7+。
pip install quickstart-vdk
vdk --help
➡ 如果您迫不及待想快速开始,请开发您的第一个数据作业


VDK SDK简介 数据摄取 数据转换 作业部署 作业运维 可扩展性 支持与贡献

数据摄取

  • 从各种来源(HTTP API、数据库、CSV等)提取数据。
  • 通过最少的转换确保数据保真度。
  • 将数据加载到您首选的目标(数据库、云存储)。

摄取示例:

将REST API数据摄取到数据库
将数据库数据摄取到数据库
将本地CSV文件摄取到数据库
使用作业属性进行增量摄取



VDK SDK简介 数据摄取 数据转换 作业部署 作业运维 可扩展性 支持与贡献

数据转换

  • SQL和Python参数化转换。
  • 可扩展的数据建模模板。
  • 创建数据集或表作为产品。

开始转换数据:

数据建模:将数据视为产品
使用SQL和本地数据库处理数据
使用Kimball仓库模板处理数据



VDK SDK简介 数据摄取 数据转换 作业部署 作业运维 可扩展性 支持与贡献

数据作业部署(构建、部署、发布)

VDK 控制服务提供 REST API,供用户在 Kubernetes 运行环境中创建、部署、管理和执行数据作业。
  • 调度、打包、依赖管理、部署。
  • 执行管理和监控。
  • 源代码版本控制和跟踪。快速回滚。
  • 使用属性和密钥管理状态和凭证。

开始在控制服务中部署作业:

使用 vdk server --install 安装本地控制服务
安排数据作业自动执行
使用 VDK DAG 编排数据作业



VDK SDK 简介 摄入 转换 作业部署 作业运维 可扩展性 支持与贡献

运维和监控

  • 使用运维界面监控和排查生产环境中的数据工作负载。
  • 数据作业部署或执行期间的错误通知。
  • 通过将错误分类为用户错误或平台错误,将错误路由给正确的人员。

开始运维和监控数据作业:

Versatile Data Kit UI - 安装和入门
VDK 运维用户界面 - Versatile Data Kit



VDK SDK 简介 摄入 转换 作业部署 作业运维 可扩展性 支持与贡献

乐高式可扩展性

  • 模块化:仅使用所需功能。可扩展:构建缺失功能。
  • 使用pip轻松安装任何插件作为Python包。
  • 用于增强数据处理、摄取、作业执行和命令行生命周期

开始使用一些VDK插件:

浏览可用插件
➡ 值得关注的插件:
       使用vdk-lineage跟踪作业血缘关系
       使用vdk-csv导入/摄取或导出CSV文件
编写自己的插件



VDK SDK简介 摄取 转换 作业部署 作业运维 可扩展性 支持与贡献

支持与贡献

如需支持,您可以加入我们的Slack频道,在GitHub上创建问题拉取请求以提交建议或更改。
如果您有兴趣作为开发者贡献,请访问贡献页面。

联系方式

行为准则

参与项目源代码工作或在任何问题跟踪器、Slack频道和邮件列表中互动的每个人都应熟悉并遵守行为准则

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号