Project Icon

awesome-LLM-game-agent-papers

大型语言模型驱动的游戏智能体研究最新进展

这个项目是关于大型语言模型(LLM)在游戏智能体研究中应用的论文集。内容涵盖文字冒险、Minecraft、社会模拟等多种游戏类型,展示LLM在游戏规划、决策和交互方面的能力。项目定期更新,为研究人员提供LLM游戏智能体领域的综合资源,助力了解该领域的前沿进展。

基于大型语言模型的游戏智能体综述

欢迎PR 访问量徽章 星标 分支

🔥 基于大型语言模型的游戏智能体必读论文。

💫 每周持续更新。 (最近更新:2024/08/11)

目录

冒险游戏

文字冒险游戏

  • [2019/09] 交互式小说游戏:巨大的冒险 AAAI 2020 [论文] [代码]
  • [2020/10] ALFWorld:对齐文本和实体环境以进行交互式学习 ICLR 2021 [论文][代码]
  • [2022/03] 科学世界:你的智能体比五年级学生聪明吗? EMNLP 2022 [论文] [代码]
  • [2022/10] ReAct:协同语言模型中的推理和行动 ICLR 2023 [论文] [[代码](https://github.com/ysymyth/ReAct]
  • [2023/03] Reflexion:具有语言强化学习的语言智能体 NeurIPS 2023 [论文] [代码]
  • [2023/04] 大型语言模型能否很好地玩文字游戏?当前技术水平和未解问题 arXiv [论文]
  • [2023/05] SwiftSage:一个具有快慢思维能力的生成智能体,用于复杂交互任务 NeurIPS 2023 [论文] [代码]
  • [2023/10] FireAct:面向语言智能体的微调 arXiv [论文][代码]
  • [2023/11] ADaPT:语言模型的按需分解和规划 arXiv [论文][代码]
  • [2024/02] 软自洽性提升语言模型智能体性能 arXiv [论文][代码]
  • [2024/02] 通过行动学习赋能大型语言模型智能体 arXiv [论文][代码]
  • [2024/03] KnowAgent:基于知识增强的LLM智能体规划 arXiv [论文][代码]
  • [2024/03] 语言引导的文本环境强化学习智能体探索 arXiv [论文][代码]
  • [2024/03] 尝试和错误:基于探索的LLM智能体轨迹优化 ACL 2024 [论文][代码]
  • [2024/04] 从失败中学习:在微调大型语言模型作为智能体时整合负面示例 arXiv[论文][代码]
  • [2024/04] ReAct遇上ActRe:当语言智能体享受训练数据自主权 [论文]
  • [2024/05] 具有世界知识模型的智能体规划 arXiv [论文][代码]
  • [2024/05] THREAD:通过递归生成进行深层思考 arXiv [论文]
  • [2024/06] 密切关注每一步!通过迭代步骤级流程改进的LLM智能体学习 arXiv [论文][代码]

视频冒险游戏

  • [2023/09] Motif: 来自人工智能反馈的内在动机 ICLR 2024 [论文] [代码]
  • [2024/03] Cradle: 赋能基础智能体实现通用计算机控制 arXiv [论文][代码]
  • [2024/03] 使用大语言模型玩NetHack: 作为零样本智能体的潜力与局限性 arXiv [论文] [代码]

制作与探索类游戏

我的世界

  • [2023/02] 描述、解释、计划和选择:通过大语言模型的交互式规划实现开放世界多任务智能体 NeurIPS 2023 [论文][代码]
  • [2023/03] Plan4MC: 面向开放世界我的世界任务的技能强化学习与规划 FMDM@NeurIPS2023 [论文][代码]
  • [2023/05] 我的世界中的幽灵:通过大语言模型、基于文本的知识和记忆实现开放世界环境中的通用能力智能体 arXiv [论文]
  • [2023/05] VOYAGER: 基于大语言模型的开放式具身智能体 FMDM@NeurIPS2023 [论文][代码]
  • [2023/10] LLaMA Rider: 激励大语言模型探索开放世界 arXiv [论文][代码]
  • [2023/10] Steve-Eye: 为基于大语言模型的具身智能体在开放世界中装备视觉感知能力 ICLR 2024 [论文]
  • [2023/11] JARVIS-1: 基于记忆增强多模态语言模型的开放世界多任务智能体 arXiv [论文][代码]
  • [2023/11] 看见并思考:虚拟环境中的具身智能体 arXiv [论文][代码]
  • [2023/12] MP5: 通过主动感知实现我的世界中的多模态开放式具身系统 CVPR 2024 [论文][代码]
  • [2023/12] Auto MC-Reward: 使用大语言模型为我的世界自动设计密集奖励 arXiv [论文]
  • [2023/12] 创造性智能体:通过想象力赋能智能体完成创造性任务 arXiv [论文][代码]
  • [2024/02] RL-GPT: 整合强化学习和代码即策略方法 arXiv [论文]
  • [2024/03] MineDreamer: 通过想象链学习遵循指令以控制模拟世界 arXiv [论文][代码]
  • [2024/07] Odyssey: 赋予智能体开放世界技能 arXiv [论文][代码]

Crafter

  • [2023/02] 使用大型语言模型指导强化学习中的预训练 ICML 2023 [论文]
  • [2023/05] SPRING:研究论文并推理以玩游戏 NeurIPS 2023 [论文]
  • [2023/06] OMNI:通过人类有趣性概念模型实现开放性 arXiv [论文][代码]
  • [2023/09] AdaRefiner:通过自适应反馈优化语言模型的决策 arXiv [论文]
  • [2024/03] EnvGen:通过大型语言模型生成和调整环境以训练具身智能体 arXiv [论文]
  • [2024/04] AgentKit:使用图而非编码进行流程工程 arXiv [论文][代码]
  • [2024/04] 带有大型语言模型提示的世界模型用于目标实现 arXiv [论文]
  • [2024/07] 通过世界动态建模增强智能体学习 arXiv [论文]

模拟游戏

人类/社会模拟

  • [2023/04] 生成式智能体:人类行为的交互式模拟 UIST 2023 [论文][代码]
  • [2023/08] AgentSims:用于大型语言模型评估的开源沙盒 arXiv [论文]
  • [2023/10] 人形智能体:模拟类人生成式智能体的平台 arXiv [论文]
  • [2023/10] Lyfe Agents:用于低成本实时社交互动的生成式智能体 arXiv [论文]
  • [2023/10] SOTOPIA:语言智能体社交智能的交互式评估 arXiv [论文][代码]
  • [2024/03] SOTOPIA-$\pi$:具有社交智能的语言智能体的交互式学习 arXiv [论文][代码]

具身模拟

  • [2022/01] 语言模型作为零样本规划器:为具身智能体提取可行动知识 ICML 2022 [论文][代码]
  • [2022/12] LLM-Planner:使用大型语言模型进行具身智能体的少样本基础规划 ICCV 2023 [论文]
  • [2023/05] 语言模型遇见世界模型:具身经验增强语言模型 NeurIPS 2023 [论文][代码]
  • [2023/10] 章鱼:从环境反馈中学习的具身视觉语言程序员 arXiv [论文] [代码]
  • [2024/01] 实践出真知:通过强化学习将大型语言模型与具身环境对齐 arXiv[论文][代码]

其他模拟

  • [2024/01] CivRealm:文明游戏中决策智能体的学习与推理之旅 ICLR 2024 [论文][代码]

竞争游戏

  • [2022/10] 涌现的世界表征:探索在合成任务上训练的序列模型 ICLR 2023 [论文]
  • [2023/06] ChessGPT:连接策略学习和语言建模 NeurIPS 2023 [论文][代码]
  • [2023/08] ChatGPT和GPT-4是否擅长打扑克?——翻牌前分析 arXiv [论文]
  • [2023/09] Suspicion-Agent:利用具有心智理论意识的GPT-4玩不完全信息游戏 arXiv [论文]
  • [2023/12] 大型语言模型玩星际争霸II:基准测试和链式总结方法 arXiv [论文][代码]
  • [2024/01] PokerGPT:通过大型语言模型实现多人德州扑克的端到端轻量级求解器 arXiv [论文]
  • [2024/01] SwarmBrain:通过大型语言模型实现星际争霸II实时策略游戏的具身代理 arXiv [论文]
  • [2024/02] PokéLLMon:使用大型语言模型的达到人类水平的宝可梦对战代理 arXiv [论文][代码]
  • [2024/02] Agent-Pro:通过策略级反思和优化学习进化 arXiv [论文][代码]
  • [2024/03] 具身LLM代理学习在有组织的团队中合作 arXiv [论文]

合作游戏

  • [2023/07] 使用大型语言模型模块化构建合作的具身代理 ICLR 2024 [论文][代码]
  • [2023/09] MindAgent:涌现的游戏交互 arXiv [论文]
  • [2023/10] 评估大型语言模型中的多代理协调能力 arXiv [论文]
  • [2023/12] 基于LLM的分层语言代理,用于实时人机协调 arXiv [论文]
  • [2024/02] S-Agents:开放式环境中的自组织代理 arXiv [论文]
  • [2024/03] ProAgent:使用大型语言模型构建主动合作代理 AAAI 2024 [论文]
  • [2024/03] LLM增强的自主代理能否合作?通过Melting Pot评估其合作能力 arXiv [论文]
  • [2024/03] 开放式多代理导航的分层自组织系统 arXiv[论文]
  • [2024/05] 面向具身多代理协作的高效LLM基础 arXiv[论文][代码]

通信(会话)游戏

  • [2022/12] 在外交游戏中通过结合语言模型和战略推理实现人类级别的表现 Science [论文]
  • [2023/08] GameEval:在对话游戏中评估大型语言模型 arXiv [论文][代码]
  • [2023/09] 探索大型语言模型在通信游戏中的应用:以狼人游戏为例的实证研究 arXiv [论文]
  • [2023/10] 使用强化学习的语言智能体在狼人游戏中进行战略博弈 arXiv [论文]
  • [2023/10] 阿瓦隆的思维游戏:通过递归思考对抗欺骗 arXiv [论文]
  • [2023/10] AvalonBench:评估大型语言模型在阿瓦隆游戏中的表现 FMDM@NeurIPS2023 [论文][代码]
  • [2023/10] 基于大型语言模型的智能体社会调查:阿瓦隆游戏中的合作与对抗 arXiv [论文]
  • [2023/10] 利用猜词游戏评估大型语言模型的智能 arXiv [论文][代码]
  • [2023/11] 战争与和平(WarAgent):基于大型语言模型的多智能体世界大战模拟 arXiv [论文][代码]
  • [2023/12] 即时合作:探索语言智能体在阿瓦隆游戏中的临时团队合作 arXiv [论文]
  • [2023/12] 解密数字侦探:理解大型语言模型在多智能体推理游戏中的行为和能力 [论文]
  • [2024/02] 提升大型语言模型在狼人游戏中的推理能力 arXiv [论文]
  • [2024/02] 如果大型语言模型有不同的世界观会怎样:用基于大型语言模型的智能体模拟外星文明 arXiv [论文]
  • [2024/04] 自我对抗性语言游戏提升大型语言模型的推理能力 [论文][代码]
  • [2024/06] PLAYER:在谋杀推理游戏中增强基于大型语言模型的多智能体通信和交互 arXiv[论文]

动作游戏

  • [2023/02] 通过在线强化学习将大型语言模型接地到交互环境中 ICML 2023 [论文][代码]
  • [2024/03] Cradle:赋能基础智能体实现通用计算机控制 arXiv [论文][代码]
  • [2024/03] GPT-4能运行DOOM吗? arXiv [论文][代码]
  • [2024/03] 使用街头霸王III实时评估大型语言模型 GitHub [代码]
  • [2024/07] Baba是AI:打破规则以超越基准 ICML 2024 [论文]

引用

如果您觉得本仓库有用,请引用我们的论文:

@misc{hu2024survey,
      标题={基于大型语言模型的游戏智能体综述}, 
      作者={Sihao Hu 和 Tiansheng Huang 和 Fatih Ilhan 和 Selim Tekin 和 Gaowen Liu 和 Ramana Kompella 和 Ling Liu},
      年份={2024},
      电子预印本={2404.02039},
      预印本库={arXiv},
      主分类={cs.AI}
}

联系方式

如果您发现任何适合但未包含的论文,请联系Sihao Hu(sihaohu@gatech.edu)。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号