项目介绍:GRID-playground
项目背景
GRID(General Robot Intelligence Development)是一个由Scaled Foundations开发的平台,其目的是为各种机器人平台快速注入安全的人工智能能力。通过基础模型和模拟,GRID旨在为机器人提供AI能力的快速原型开发。
核心技术
GRID的核心是Foundation Mosaic,这是一种结合了感知、状态估计、安全性和控制等多个基础模型的组合。在GRID的架构中,由大型语言模型(如GPT-4)驱动的编排和推理层支持自然交互,利用这些模型解决复杂的机器人任务。此外,GRID使用AirGen,一款最先进的航空机器人模拟器,用于数据生成和评估。模块化的设计使得多种深度机器学习组件和现有基础模型可以容易地用于更广泛的机器人中心问题。
组成部分
GRID主要由以下部分构成:
- AirGen:一款具备高保真度的航空机器人模拟器,提供丰富的合成和地理环境及多模式传感。
- 基础模型:一组在感知、控制、安全等领域的先进模型。
- 大型语言模型:集成GPT-4用于自然语言交互、编排、推理和代码生成。
许可与使用
GRID的使用受Responsible AI License管理,可免费用于非商业研究用途。用户若在研究中使用GRID,请按照以下方式引用:
@techreport{vemprala2023grid,
title={GRID: A Platform for General Robot Intelligence Development},
author={Sai Vemprala and Shuhang Chen and Abhinav Shukla and Dinesh Narayanan and Ashish Kapoor},
year={2023},
eprint={2310.00887},
archivePrefix={arXiv},
primaryClass={cs.RO}
}
如何开始
要开始使用GRID和AirGen,请访问我们的用户门户并注册账号。学术用户请使用学术邮箱(如.edu, .ac.*等)注册以获得平台的无限制访问权限。访问我们的快速入门文档获取完整的设置指南。
模拟功能
在GRID中,模拟在数据生成、评估和反馈等方面起到核心作用。AirGen模拟器是一款基于AirSim构建的高保真航空机器人模拟器,它能够模拟各种场景(包括合成和地理空间的场景)并生成丰富的传感器模式集数据,使得在多种环境下进行大规模数据生成成为可能。
应用场景
我们尝试使用GRID设定并解决多个机器人相关的场景,这些场景证明了GRID内丰富的模型集合与大型语言模型(LLM)的有效联合,使得机器人智能的快速原型开发成为可能并且具有实际部署性。
-
野火搜救
-
基于视觉的着陆
-
基础设施检查
-
基于碰撞时间的安全导航
GRID平台目前处于alpha阶段,并在不断发展,我们会不断添加新功能和示例脚本,敬请关注更新!