令人惊叹的具身人工智能

这是一个精心策划的具身人工智能领域优秀论文清单，以及相关研究/行业驱动资源，灵感来自awesome-computer-vision。

具身人工智能已经带来了新的突破，本仓库将持续追踪和总结相关研究或工业进展。

- 欢迎贡献，请随时提交拉取请求或与我联系。

如果您觉得这个仓库有帮助，请考虑给予星标⭐或分享⬆️。

研讨会、教程、讲座、博客等

论文

综述

2024

数据解释器：用于数据科学的大型语言模型智能体
软件开发的交流智能体
在网络上暴露语言模型智能体在顺序任务组合中的局限性
软件开发智能体的体验式共同学习
EASYTOOL：通过简洁的工具说明增强基于大型语言模型的智能体
具身人工智能调查：从模拟器到研究任务
教育中的具身人工智能：对身体、环境和心智的回顾
智能体人工智能：调查多模态交互的视野
学习为具身人工智能智能体生成上下文敏感的反馈微笑，应用于心理健康对话
Alexa竞技场：一个以用户为中心的具身人工智能交互平台
针对幼儿的人工智能教育：技术增强具身学习的案例研究
EmbodiedGPT：通过具身思维链进行视觉语言预训练
咖啡厅场景中的多模态具身交互智能体
因果关系在具身人工智能基础世界模型中的关键作用
基础模型机器人学调查：迈向具身人工智能
我们在寻找具身智能人工视觉皮层的过程中处于何处？
具身智能体跨域策略迁移的全面调查
人机交互中的主体感
"别忘了把牛奶放回去！"用于使具身智能体能够检测异常情况的数据集
具身智能的视觉语言导航：一项调查
用于开放式多智能体导航的分层自组织系统
Velma：大型语言模型智能体在街景中视觉语言导航的语言化具身
具身智能体的空间感知变换器记忆
VELMA：大型语言模型智能体在街景中视觉语言导航的语言化具身
具身人类活动识别
LoTa-Bench：为具身智能体基准测试面向语言的任务规划器
EDGI：用于具身智能体规划的等变扩散
大型多模态智能体：一项调查
自我中心规划：用于可扩展具身任务成就
EnvGen：通过大型语言模型生成和适应环境以训练具身智能体
虚拟现实中的人机团队及其对信任校准的影响
与Ted交谈：一个面向照护者的具身会话智能体
MOPA：使用点目标智能体进行模块化物体导航
用于慢性疾病的具身会话智能体：范围审查
通过沉浸式虚拟现实环境中基于生成式人工智能的虚拟助手实现解剖学教育
通过智能体分析改进大型语言模型的任务学习知识提取
基于大型语言模型的游戏智能体调查
Autort：用于大规模编排机器人智能体的具身基础模型
迈向太空中的异构多智能体系统
具身机器学习
渗透性人工智能：让大型语言模型理解物理世界
WebVLN：网站上的视觉语言导航
生成意义：主动推理以及被动人工智能的范围和限制
RoboHive：一个统一的机器人学习框架
基于接地的解码：使用接地模型引导具身智能体的文本生成
大型语言模型时代的图灵测试
用于决策的生成模型
AgentScope：一个灵活且稳健的多智能体平台:octocat:
MMMU：面向专家AGI的大规模多学科多模态理解与推理基准:octocat:
MuLan：用于渐进式多目标扩散的多模态大语言模型智能体:octocat:
具身智能的视觉语言导航：一项调查
一个交互式智能体基础模型
UFO：一个用于Windows操作系统交互的以UI为中心的智能体:octocat:

Awesome-Embodied-AI

令人惊叹的具身人工智能

目录

研讨会、教程、讲座、博客等

论文

综述

2024

机器人学

导航

研发

大语言模型驱动

趋势

2023