Project Icon

open_x_embodiment

统一格式机器人数据集和RT-X模型

Open X-Embodiment项目整合多个开源机器人数据集,采用统一RLDS格式。它提供RT-1-X模型检查点,支持RGB图像输入和7维机械臂动作输出。项目包含数据集可视化和模型推理Colab示例,以及详细使用指南。这一开放资源促进机器人学习研究,简化数据处理和模型应用流程。

开放跨实体化

开放跨实体化旨在以统一格式提供所有开源机器人数据,以便于下游使用。

使用开放跨实体化数据集的首个出版物是《开放跨实体化:机器人学习数据集和RT-X模型》。

数据集访问

数据集结构

每个数据集表示为一系列情节,每个情节使用RLDS情节格式表示。

数据集Colab

我们提供了一个自包含的Colab,演示如何从每个数据集中可视化几个情节,以及如何创建用于训练和推理的数据批次。

数据集列表

我们在数据集电子表格中提供了作为开源努力的一部分包含的数据集列表及其元数据。

RT-1-X模型检查点

观察空间说明

该模型以机器人工作空间相机的RGB图像和描述机器人应执行任务的任务字符串作为输入。

模型应执行的任务完全通过任务字符串传达给模型。图像向模型传达当前世界状态,即假设模型以3赫兹运行,每333毫秒,我们将机器人工作空间相机的最新RGB图像输入模型以获取下一步行动。

请注意,该模型目前不接收额外的相机图像,如腕部相机图像、手持相机图像或深度图像。

动作空间说明

我们考虑的动作维度包括抓手移动的七个变量(x、y、z、滚动、俯仰、偏航、抓手开合)。每个变量代表绝对值、维度值的变化量或维度的速度。

训练过的RT-1-X TensorFlow检查点的推理Colab演示了如何加载模型检查点,在离线情节上运行推理,并叠加预测和真实动作。

RT-1-X JAX检查点

可以通过以下方式下载可被rt1_inference_example.py中的flax检查点加载器使用的JAX检查点:

gsutil -m cp -r gs://gdm-robotics-open-x-embodiment/open_x_embodiment_and_rt_x_oss/rt_1_x_jax .

常见问题和问题

找不到数据集

如果在尝试运行tfds.load({dataset_name})时遇到此问题:

tensorflow_datasets.core.registered.DatasetNotFoundError: Dataset {dataset_name} not found.

请尝试通过运行以下命令手动下载数据集:

gsutil -m cp -r gs://gdm-robotics-open-x-embodiment/{dataset_name} ~/tensorflow_datasets/

这样下载数据集后,您就可以使用常规的tfds.load({dataset_name})命令了!

引用

如果您在研究中使用开放跨实体化数据集和RT-X,请引用。如果您特别使用了为联合努力贡献的数据集,也请引用这些数据集。数据集电子表格包含每个数据集的引用信息,方便您使用。

许可和免责声明

这不是Google的官方产品。

版权所有 2023 DeepMind Technologies Limited。

  • 所有软件均根据Apache许可证2.0版(Apache 2.0)授权;除非遵守Apache 2.0许可,否则不得使用此文件。您可以在以下地址获取Apache 2.0许可的副本:https://www.apache.org/licenses/LICENSE-2.0

  • 所有其他材料均根据知识共享署名4.0国际许可证(CC-BY)授权。您可以在以下地址获取CC-BY许可的副本:https://creativecommons.org/licenses/by/4.0/legalcode

  • 除非适用法律要求或书面同意,否则根据Apache 2.0或CC-BY许可分发的所有软件和材料均按"原样"分发,不附带任何明示或暗示的担保或条件。请参阅这些许可中的具体条款,了解这些许可下的权限和限制。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号