Project Icon

ravens

PyBullet仿真中的视觉机器人操纵任务集合

Ravens项目提供了一系列在PyBullet中模拟的任务,专注于学习基于视觉的机器人抓取与放置操作。项目包含一个类似Gym的API和10个桌面排布任务,每个任务包括专家演示脚本和奖励函数,用于模仿学习和强化学习。该项目展示了Transporter Network的效率,通过重新排列深度特征来推断视觉输入的空间位移,从堆叠积木到处理变形绳索,学习速度和推广能力均优于基准方法。

Ravens 项目介绍

Ravens 项目是一个基于 PyBullet 的模拟任务合集,旨在帮助在视觉基础上学习机器人操作,特别是抓取和放置任务。它采用类似 Gym 的 API,提供了 10 种桌面重排任务,包括脚本化的专家演示(用于模仿学习)和奖励函数(用于强化学习)。

任务描述

  1. L形块插入:拾取红色 L 形积木并放入相应的 L 形槽中。
  2. 放置红色在绿色中:拾取红色积木,放入绿碗中,与其它物体隔开。
  3. 汉诺塔:依次移动圆盘,较小圆盘只能放在较大圆盘上。
  4. 对齐箱子角落:拾取不同大小的箱子,对齐台面上的 L 形标记。
  5. 堆叠砖块金字塔:按彩虹色序依次堆叠 6 块砖到金字塔形状。
  6. 货盘码箱:拾取相同规格的箱子,在托盘上层层交错堆叠。
  7. 组装工具包:拾取不同物体,按板上对应轮廓排列。
  8. 装箱:拾取不同大小的箱子,紧密放入容器中。
  9. 操控绳索:重新排列变形的绳子,使其连接 3 边方形的两个端点。
  10. 清扫小堆:将小物体推入台面上标记的目标区域。

部分任务需要对看不见的物体进行泛化 (如任务 d, g, h),或需要闭环反馈的多步骤序列操作 (如任务 c, e, f, h, i, j)。

开发团队

该项目由 Andy Zeng、Pete Florence、Daniel Seita、Jonathan Tompson 和 Ayzaan Wahid 所开发和维护,详细信息可在相关学术论文中查找。

Transporter 网络概述

Transporter 网络是一种简单的模型架构,通过视觉输入重排深度特征以推导空间位移,可用于参数化机器人动作。该方法不依赖于物体模型,利用空间对称性,并在学习基于视觉的操作任务中,比传统方法更高效。Transporter 网络能表示复杂的多模态策略分布,适用于多步骤序列任务以及 6DoF 抓取和放置操作。

安装指南

  1. 安装 Miniconda

    • 推荐使用 Miniconda 来管理 Python 环境。
  2. 创建并激活 Conda 环境

    • 安装 GCC 和所需的 Python 包。
  3. 安装 GPU 加速

    • 推荐使用 NVIDIA CUDA 和 cuDNN 加快 Tensorflow 的运行速度。

同时提供了直接使用 pip 的替代方案,具体操作请参考项目说明。

使用指南

  1. 生成训练和测试数据

    • 数据保存在本地,支持无头模式运行。
  2. 训练模型

    • 以 Transporter 网络模型为例,模型检查点保存在 checkpoints 目录。
  3. 评估模型

    • 使用经过训练的模型对 Transporter 网络代理进行评估。
  4. 结果可视化

    • 通过生成图表展示评估结果。

此外,还可以使用 Tensorboard 跟踪训练和验证损失。

数据集和预训练模型

项目提供预生成的训练和测试数据集以及预训练模型以供下载。每个任务的 MDP 形式包含以下结构:

  • 观测值:原始 RGB-D 图像和相机参数。
  • 动作:机器人的原始动作函数及其参数。
  • 奖励:成功执行单元任务的奖励总和等于 1。
  • 信息:物体的 6D 姿态、大小和颜色。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号