Project Icon

WeDataSphere

综合开源大数据开发和管理平台

WeDataSphere是一个综合性开源大数据平台,提供从数据处理到应用开发的全套解决方案。它整合了多个开源组件,支持跨引擎协作和统一管理,满足企业在数据分析、质量控制和机器学习等方面的需求,同时保证高级别的安全性和多租户隔离。

英文 | 中文

WeDataSphere 开源组件

图像中带有蓝色"S"球的项目都是开源的。包括 DataSphere StudioLinkisScriptisQualitisSchedulisExchangisVisualisProphecisStreamis
OSProjects

Apache Linkis(孵化中)

点击前往 Github 仓库

Linkis 建立了一个计算中间件层,用于解耦上层应用程序和底层数据引擎,提供标准化接口(REST、JDBC、WebSocket等),以便轻松连接到各种底层引擎(Spark、Presto、Flink等),同时还支持跨引擎上下文共享、统一任务和引擎治理及协调。

DataSphere Studio

点击前往 Github 仓库

DataSphere Studio 定位为数据应用程序开发门户,整个过程的闭环覆盖了数据应用程序开发的整个生命周期。通过统一的UI,基于工作流的图形化拖放开发体验满足从数据导入、脱敏清洗、数据分析、数据挖掘、质量检查、可视化、调度到数据输出应用等数据应用程序开发的全生命周期需求。

Scriptis

点击前往 Github 仓库

Scriptis 是一款用于交互式数据分析的脚本开发(SQL、Pyspark、HiveQL)、任务提交(Spark、Hive)、UDF、函数、资源管理和智能诊断的工具。

Qualitis

点击前往 Github 仓库

Qualitis 是一个一站式数据质量管理平台,支持对各类数据源的质量验证、通知和管理,用于解决数据处理过程中产生的各种数据质量问题。

Schedulis

点击前往 Github 仓库

Schedulis 是一个高性能的工作流任务调度系统,支持高可用和多租户金融级别特性,集成了 Linkis 计算中间件,并已融入数据应用程序开发门户 DataSphere Studio。

Exchangis

点击前往 Github 仓库

Exchangis 是一个轻量级、高度可扩展的数据交换平台,支持在结构化和非结构化异构数据源之间进行数据传输。在应用层面,它具有诸如数据权限管理和控制、节点服务的高可用性以及多租户资源隔离等业务特性。在数据层面,它还具有多样化的传输架构、模块化插件以及组件低耦合等架构特征。

Visualis

点击前往 Github 仓库

Visualis 是基于易信 Davinci 开发的开源数据可视化 Bi 工具。在此版本中,它已经集成到了数据应用程序开发门户 Datasphere Studio 中,Visualis 1.0.0 支持 Linkis 1.1.1 和 DSS 1.1.0。

Prophecis

点击前往 Github 仓库 Prophecis是由WeBank开发的一站式机器学习平台。它集成了多个开源机器学习框架,拥有机器学习计算集群的多租户管理能力,并为生产环境提供全栈容器部署和管理服务。

Streamis

点击前往GitHub仓库

Streamis是由WeBank、CtYun、Samoyed Financial Cloud和XianWeng Technology联合开发的流式应用程序开发和管理项目。

更多开源WDS组件?敬请期待...

WeDataSphere介绍

WeDataSphere是一个金融级别的一站式大数据平台开源套件。基础平台由4个层面构成:数据交换、数据分发、计算和存储;功能平台由3个层面构成:平台工具、数据工具和应用工具,针对各类用户需求提供功能性工具实现。这些构建了一个完整的大数据平台技术生态系统,提供一站式的充分组件和功能支持。

WeDataSphere核心特性

  • 基础能力

依托于社区贡献的各类开源组件,如Hadoop、Spark、Hbase、KubeFlow和FFDL,WeDataSphere在基础的数据计算、存储和交换方面达到了金融级别的可靠性。同时,我们也针对这些开源版本进行了增强,解决了实际应用中的安全性、性能、可用性和可管理性等问题。

  • 平台工具

包括平台门户、数据中间件(Linkis)和运维管理系统。平台门户支持产品地图、财务费用计算和云服务申请;作为数据中间件,Linkis连接具体应用程序与底层计算/存储系统,具备金融级别的多租户、资源治理和访问隔离能力,填补了开源社区和行业的空白;运维管理系统包括集群管理、配置管理、变更管理和服务请求自动化,支持一键安装、一键升级和图形化运维,提供报警、健康监测&诊断和自动恢复功能,简化了平台的运维过程。

  • 数据工具

包括数据地图、数据脱敏、数据质量和跨Hadoop集群的数据交换工具。数据地图管理整个银行的通用数据资源,包含元数据管理、数据访问控制、数据血缘和正在开发的数据质量及数据模型功能。数据脱敏可以对高度机密的数据进行脱敏,防止用户直接访问。数据质量工具提供了独特的流程来定义和检测数据集的质量,并可立即报告问题。跨Hadoop集群的数据交换工具支持数据交换任务的调度、监控、统计和管理。

  • 应用工具

包括开发&探索工具(Scriptis)、图形化工作流调度系统、数据可视化BI工具和机器学习支持系统。Scriptis与各种计算/存储引擎连接,提供图形界面和多语言开发支持。图形化工作流调度系统提供了工作流定义、任务执行、依赖关系展示、状态显示、历史统计和监控配置的图形界面。数据可视化BI工具通过拖拽操作和简单脚本生成各类图表,并支持定时邮件。机器学习支持系统支持多种模型训练模式,包括自研ML算法和开源ML框架,具备高性能计算集群的多租户管理能力。

WeDataSphere主要优势


![WDSAdvantages](https://yellow-cdn.veclightyear.com/ab5030c0/40b85338-203e-4b28-b8de-1ed4e005d9f2.png)
  • 一站式

    平台工具、数据工具和应用工具3个层面,加上强大的机器学习能力,构建了企业级大数据解决方案。

  • 跨集群同步

    在2个城市的3个数据中心之间实现高效可靠的大数据传输,配备了完善的数据备份和容灾方案。

  • 金融级

    统一的安全控制,全面采用容器/微服务,各层面实现多租户隔离。

  • 无缝体验

    独特的数据中间件(Linkis)将不同层面的系统连接起来,带来了数据血缘、代码可重用性和用户资源的统一。

  • 开源

    核心组件已经开源,其余也即将开源。

WeDataSphere社区

如需即时响应,请向我们提出issue或扫描下方二维码通过微信和QQ加入我们的群组:
weChatAndQQ

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号