Project Icon

ravens

PyBullet仿真中的视觉机器人操纵任务集合

Ravens项目提供了一系列在PyBullet中模拟的任务,专注于学习基于视觉的机器人抓取与放置操作。项目包含一个类似Gym的API和10个桌面排布任务,每个任务包括专家演示脚本和奖励函数,用于模仿学习和强化学习。该项目展示了Transporter Network的效率,通过重新排列深度特征来推断视觉输入的空间位移,从堆叠积木到处理变形绳索,学习速度和推广能力均优于基准方法。

Ravens 项目介绍

Ravens 项目是一个基于 PyBullet 的模拟任务合集,旨在帮助在视觉基础上学习机器人操作,特别是抓取和放置任务。它采用类似 Gym 的 API,提供了 10 种桌面重排任务,包括脚本化的专家演示(用于模仿学习)和奖励函数(用于强化学习)。

任务描述

  1. L形块插入:拾取红色 L 形积木并放入相应的 L 形槽中。
  2. 放置红色在绿色中:拾取红色积木,放入绿碗中,与其它物体隔开。
  3. 汉诺塔:依次移动圆盘,较小圆盘只能放在较大圆盘上。
  4. 对齐箱子角落:拾取不同大小的箱子,对齐台面上的 L 形标记。
  5. 堆叠砖块金字塔:按彩虹色序依次堆叠 6 块砖到金字塔形状。
  6. 货盘码箱:拾取相同规格的箱子,在托盘上层层交错堆叠。
  7. 组装工具包:拾取不同物体,按板上对应轮廓排列。
  8. 装箱:拾取不同大小的箱子,紧密放入容器中。
  9. 操控绳索:重新排列变形的绳子,使其连接 3 边方形的两个端点。
  10. 清扫小堆:将小物体推入台面上标记的目标区域。

部分任务需要对看不见的物体进行泛化 (如任务 d, g, h),或需要闭环反馈的多步骤序列操作 (如任务 c, e, f, h, i, j)。

开发团队

该项目由 Andy Zeng、Pete Florence、Daniel Seita、Jonathan Tompson 和 Ayzaan Wahid 所开发和维护,详细信息可在相关学术论文中查找。

Transporter 网络概述

Transporter 网络是一种简单的模型架构,通过视觉输入重排深度特征以推导空间位移,可用于参数化机器人动作。该方法不依赖于物体模型,利用空间对称性,并在学习基于视觉的操作任务中,比传统方法更高效。Transporter 网络能表示复杂的多模态策略分布,适用于多步骤序列任务以及 6DoF 抓取和放置操作。

安装指南

  1. 安装 Miniconda

    • 推荐使用 Miniconda 来管理 Python 环境。
  2. 创建并激活 Conda 环境

    • 安装 GCC 和所需的 Python 包。
  3. 安装 GPU 加速

    • 推荐使用 NVIDIA CUDA 和 cuDNN 加快 Tensorflow 的运行速度。

同时提供了直接使用 pip 的替代方案,具体操作请参考项目说明。

使用指南

  1. 生成训练和测试数据

    • 数据保存在本地,支持无头模式运行。
  2. 训练模型

    • 以 Transporter 网络模型为例,模型检查点保存在 checkpoints 目录。
  3. 评估模型

    • 使用经过训练的模型对 Transporter 网络代理进行评估。
  4. 结果可视化

    • 通过生成图表展示评估结果。

此外,还可以使用 Tensorboard 跟踪训练和验证损失。

数据集和预训练模型

项目提供预生成的训练和测试数据集以及预训练模型以供下载。每个任务的 MDP 形式包含以下结构:

  • 观测值:原始 RGB-D 图像和相机参数。
  • 动作:机器人的原始动作函数及其参数。
  • 奖励:成功执行单元任务的奖励总和等于 1。
  • 信息:物体的 6D 姿态、大小和颜色。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号