令人惊叹的具身人工智能
这是一个精心策划的具身人工智能领域优秀论文清单,以及相关研究/行业驱动资源,灵感来自awesome-computer-vision。
具身人工智能已经带来了新的突破,本仓库将持续追踪和总结相关研究或工业进展。
- 欢迎贡献,请随时提交拉取请求或与我联系。
如果您觉得这个仓库有帮助,请考虑给予星标⭐或分享⬆️。
目录
研讨会、教程、讲座、博客等
论文
综述
- 将网络空间与物理世界对齐:具身人工智能综合调查
- 具身智能的视觉语言导航:一项调查
- 大型语言模型驱动的智能体的崛起和潜力:一项调查
- 具身人工智能调查:从模拟器到研究任务
- 基于大型语言模型的自主智能体调查
- 基于自然语言的心智社会中的思维风暴
2024
- 数据解释器:用于数据科学的大型语言模型智能体
- 软件开发的交流智能体
- 在网络上暴露语言模型智能体在顺序任务组合中的局限性
- 软件开发智能体的体验式共同学习
- EASYTOOL:通过简洁的工具说明增强基于大型语言模型的智能体
- 具身人工智能调查:从模拟器到研究任务
- 教育中的具身人工智能:对身体、环境和心智的回顾
- 智能体人工智能:调查多模态交互的视野
- 学习为具身人工智能智能体生成上下文敏感的反馈微笑,应用于心理健康对话
- Alexa竞技场:一个以用户为中心的具身人工智能交互平台
- 针对幼儿的人工智能教育:技术增强具身学习的案例研究
- EmbodiedGPT:通过具身思维链进行视觉语言预训练
- 咖啡厅场景中的多模态具身交互智能体
- 因果关系在具身人工智能基础世界模型中的关键作用
- 基础模型机器人学调查:迈向具身人工智能
- 我们在寻找具身智能人工视觉皮层的过程中处于何处?
- 具身智能体跨域策略迁移的全面调查
- 人机交互中的主体感
- "别忘了把牛奶放回去!"用于使具身智能体能够检测异常情况的数据集
- 具身智能的视觉语言导航:一项调查
- 用于开放式多智能体导航的分层自组织系统
- Velma:大型语言模型智能体在街景中视觉语言导航的语言化具身
- 具身智能体的空间感知变换器记忆
- VELMA:大型语言模型智能体在街景中视觉语言导航的语言化具身
- 具身人类活动识别
- LoTa-Bench:为具身智能体基准测试面向语言的任务规划器
- EDGI:用于具身智能体规划的等变扩散
- 大型多模态智能体:一项调查
- 自我中心规划:用于可扩展具身任务成就
- EnvGen:通过大型语言模型生成和适应环境以训练具身智能体
- 虚拟现实中的人机团队及其对信任校准的影响
- 与Ted交谈:一个面向照护者的具身会话智能体
- MOPA:使用点目标智能体进行模块化物体导航
- 用于慢性疾病的具身会话智能体:范围审查
- 通过沉浸式虚拟现实环境中基于生成式人工智能的虚拟助手实现解剖学教育
- 通过智能体分析改进大型语言模型的任务学习知识提取
- 基于大型语言模型的游戏智能体调查
- Autort:用于大规模编排机器人智能体的具身基础模型
- 迈向太空中的异构多智能体系统
- 具身机器学习
- 渗透性人工智能:让大型语言模型理解物理世界
- WebVLN:网站上的视觉语言导航
- 生成意义:主动推理以及被动人工智能的范围和限制
- RoboHive:一个统一的机器人学习框架
- 基于接地的解码:使用接地模型引导具身智能体的文本生成
- 大型语言模型时代的图灵测试
- 用于决策的生成模型
- AgentScope:一个灵活且稳健的多智能体平台:octocat:
- MMMU:面向专家AGI的大规模多学科多模态理解与推理基准:octocat:
- MuLan:用于渐进式多目标扩散的多模态大语言模型智能体:octocat:
- 具身智能的视觉语言导航:一项调查
- 一个交互式智能体基础模型
- UFO:一个用于Windows操作系统交互的以UI为中心的智能体:octocat:
机器人学
导航
研发
- OpenAgent :octocat:
大语言模型驱动
- 交互式代理基础模型
- AutoGen, EcoOptiGen
- AgentTuning:为大语言模型实现通用代理能力
- AgentBench:评估大语言模型作为代理的表现
- 基于大语言模型的代理的兴起与潜力:一项调查
- 自主语言代理的开源框架
- MetaGPT:多代理协作框架的元编程
- AgentVerse:促进多代理协作并探索代理的涌现行为
- ModelScope-Agent:使用开源大语言模型构建可定制的代理系统
- 使用大语言模型进行具身任务规划
- 使用大语言模型模块化构建协作具身代理
- 用于具身推理的状态维持语言模型
- 基于语言场景总结的具身可执行策略学习
- Voyager:一个使用大语言模型的开放式具身代理
- 简单具身语言学习作为元强化学习的副产品
- 视觉-语言任务
- 探索大语言模型在通信游戏中的应用:狼人杀的实证研究