基于大语言模型代理的崛起与潜力:一项综述
🔥 LLM代理必读论文。
🏃 即将推出:为每篇论文添加一句话简介。
🔔 新闻
- ☄️ [2024/06/07] AgentGym已发布,用于在各种环境中开发和演化基于LLM的代理!
- 论文:AgentGym。
- 项目页面:https://agentgym.github.io/。
- 代码:平台和实现。
- Huggingface资源:AgentTraj-L,AgentEval,AgentEvol-7B。
- 🎉 [2024/05/02] R3(通过逆向课程强化学习训练大语言模型进行推理)被ICML 2024接收!
- 💫 [2024/02/08] 新论文R3关于LLM代理推理的RL已发布!论文:通过逆向课程强化学习训练大语言模型进行推理。代码:LLM-逆向课程-RL。
- 🥳 [2023/09/20] 该项目已被列入GitHub Trending!这是莫大的荣幸!
- 💥 [2023/09/15] 我们的综述发布了!请参阅基于大语言模型代理的崛起与潜力:一项综述获取论文!
- ✨ [2023/09/14] 我们创建了此库,以维护基于LLM的代理的论文列表。更多论文即将推出!
🌟 引言
长期以来,人类一直在追求与人类水平相当或超越人类水平的人工智能(AI),AI代理被认为是这一追求的有前途的载体。AI代理是感知其环境、做出决策并采取行动的人工实体。
由于其展示出的多功能和非凡能力,大语言模型(LLM)被认为是通用人工智能(AGI)的潜在火花,为构建通用AI代理带来了希望。许多研究工作利用LLM作为构建AI代理的基础,并取得了显著进展。
在这个仓库中,我们提供了一项关于基于LLM的代理的系统且全面的综述,并列出了一些必读的论文。
具体来说,我们从基于LLM的代理的一般概念框架开始:由三个主要部分组成:大脑、感知和行动,并且该框架可以根据不同的应用进行定制。 随后,我们探讨了基于LLM的代理在三方面的广泛应用:单代理场景、多代理场景和人机合作。 接着,我们深入研究了代理社会,探讨了基于LLM的代理的行为和个性、当它们形成社会时出现的社会现象及其对人类社会的启示。 最后,我们讨论了该领域内的一些关键话题和开放问题。
我们非常欢迎通过PR、问题、电子邮件或其他方式做出的任何贡献。
内容目录 (ToC)
- 基于大语言模型代理的崛起与潜力:一项综述
- 🔔 新闻
- 🌟 引言
- 内容目录 (ToC)
- 1. 代理的诞生:基于LLM代理的构建
- 2. 代理实践:基于LLM代理的应用
- 3. 代理社会:从个体到社会
- 3.1 基于LLM代理的行为和个性
- 3.2 代理社会的环境
- [3.2.1 基于文本的环境](#321-
- [2023/06] 聪明的汉斯还是神经心智理论?全面检测大语言模型的社会推理能力。 Natalie Shapira 等. arXiv. [论文]
- 大语言模型展示了某些心智理论能力,但这种行为还远未达到稳健。
- [2022/08] 从上下文语言中推断奖励。 Jessy Lin 等. ACL. [论文]
- 本工作提出了一个模型,可以从语言中推断奖励,并在未见过的环境中预测最佳动作。
- [2021/10] 基于心智理论的复杂人机协作中的辅助沟通。 Moritz C. Buehler 等. arXiv. [论文]
- 本工作设计了一个名为Sushi的代理,在互动过程中理解人类。
1.1.2 知识
预训练模型
- [2023/04] 从无标签数据中学习句子的分布式表示。 Felix Hill (剑桥大学) 等. arXiv. [论文]
- [2020/02] 语言模型的参数中能包含多少知识? Adam Roberts (谷歌) 等. arXiv. [论文]
- [2020/01] 神经语言模型的扩展法则。 Jared Kaplan (约翰霍普金斯大学) 等. arXiv. [论文]
- [2017/12] 机器智能中的常识知识。 Niket Tandon (艾伦人工智能研究所) 等. SIGMOD. [论文]
- [2011/03] (几乎)从零开始进行自然语言处理。 Ronan Collobert (普林斯顿) 等. arXiv. [论文]
语言学知识
- [2023/02] 对ChatGPT在推理、幻觉和互动性方面的多任务、多语言、多模态评价。 Yejin Bang 等. arXiv. [论文]
- [2021/06] 探究预训练语言模型的语义属性及其值。 Meriem Beloucif 等. EMNLP. [论文]
- [2020/10] 探究预训练语言模型的词汇语义。 Ivan Vulić 等. arXiv. [论文]
- [2019/04] 用结构探针寻找词表示中的句法。 John Hewitt 等. ACL. [论文]
- [2016/04] 在具有更多语义知识的情况下改进自动关键词提取。 H Leung. 系统高级应用. [论文]
常识知识
- [2022/10] 代码语言模型是小样本常识学习者。 Aman Madaan 等. arXiv. [论文]
- [2021/04] 上下文语言模型的关系性世界知识表示:综述。 Tara Safavi 等. arXiv. [论文]
- [2019/11] 我们如何知道语言模型知道什么? Zhengbao Jiang 等. arXiv. [论文]
可操作知识
- [2023/07] 医学中的大语言模型。 Arun James Thirunavukarasu 等. Nature. [论文]
- [2023/06] DS-1000:数据科学代码生成的自然且可靠的基准。 Yuhang Lai 等. ICML. [论文]
- [2022/10] 代码语言模型是小样本常识学习者。 Aman Madaan 等. arXiv. [论文]
- [2022/02] 对大规模代码语言模型的系统评价。 Frank F. Xu 等. arXiv. [论文]
- [2021/10] 训练验证器解决数学文字题。 Karl Cobbe 等. arXiv. [论文]
知识潜在问题
- [2023/10] FreshLLMs:用搜索引擎增强更新大语言模型。 Tu Vu (谷歌) 等. arXiv. [论文] [代码]
- [2023/05] 大语言模型的编辑:问题、方法和机遇。 Yunzhi Yao 等. arXiv. [论文]
- [2023/05] Self-Checker:用于大语言模型的即插即用模块进行事实核查。 Miaoran Li 等. arXiv. [论文]
- [2023/05] CRITIC:大语言模型可以通过互动工具自主纠正。 Zhibin Gou 等. arXiv. [论文]
- [2023/04] 基础模型与工具学习。 Yujia Qin 等. arXiv. [论文]
- [2023/03] SelfCheckGPT:零资源黑箱幻觉检测生成式大语言模型。 Potsawee Manakul 等. arXiv. [论文]
- [2022/06] 大规模的基于记忆的模型编辑。 Eric Mitchell 等. arXiv. [论文]
- [2022/04] 语言模型作为知识库的综述。 Badr AlKhamissi 等. arXiv. [论文]
- [2021/04] 在语言模型中编辑事实知识。 Nicola De Cao 等. arXiv. [论文]
- [2017/08] 测量神经网络中的灾难性遗忘。 Ronald Kemker 等. arXiv. [论文]
1.1.3 记忆
记忆能力
提高Transformer的长度限制
- [2023/10] MemGPT:向作为操作系统的LLMs迈进。 Charles Packer (加州大学伯克利分校) 等. arXiv. [论文] [项目页面] [代码] [数据集]
- [2023/05] 随机位置编码增强Transformer的长度泛化能力。 Anian Ruoss (DeepMind) 等. arXiv. [论文] [代码]
- [2023/03] CoLT5:具有条件计算的更快的长距离Transformer。 Joshua Ainslie (谷歌研究) 等. arXiv. [论文]
- [2022/03] 使用Transformer高效分类长文档。 Hyunji Hayley Park (伊利诺伊大学) 等. arXiv. [论文] [代码]
- [2021/12] LongT5:用于长序列的高效文本到文本Transformer。 Mandy Guo (谷歌研究) 等. arXiv. [论文] [代码]
- [2019/10] BART:用于自然语言生成、翻译和理解的降噪序列到序列预训练。 Michael Lewis (Facebook AI) 等. arXiv. [论文] [代码]
总结记忆
- [2023/10] 走进记忆迷宫:通过互动阅读突破上下文限制 Howard Chen (普林斯顿大学) 等 arXiv. [论文]
- [2023/09] 通过链式大型语言模型赋能私人辅导 Yulin Chen (清华大学) 等 arXiv. [论文]
- [2023/08] ExpeL: 大型语言模型代理是体验学习者 Andrew Zhao (清华大学) 等 arXiv. [论文] [代码]
- [2023/08] ChatEval: 通过多代理辩论改进基于大型语言模型的评估 Chi-Min Chan (清华大学) 等 arXiv. [论文] [代码]
- [2023/05] MemoryBank: 为大型语言模型增强长期记忆 Wanjun Zhong (哈尔滨工业大学) 等 arXiv. [论文] [代码]
- [2023/04] 生成代理:人类行为的互动拟像 Joon Sung Park (斯坦福大学) 等 arXiv. [论文] [代码]
- [2023/04] 释放无限长度输入容量:自控记忆系统在大型语言模型中的应用 Xinnian Liang (北京航空航天大学) 等 arXiv. [论文] [代码]
- [2023/03] Reflexion: 具有语言强化学习的语言代理 Noah Shinn (东北大学) 等 arXiv. [论文] [代码]
- [2023/05] RecurrentGPT: 交互式生成(任意)长文本 Wangchunshu Zhou (AIWaves) 等 arXiv. [论文] [代码]
使用向量或数据结构压缩记忆
- [2023/07] 面向软件开发的通信代理 Chen Qian (清华大学) 等 arXiv. [论文] [代码]
- [2023/06] ChatDB: 增强大型语言模型的符号记忆的数据库 Chenxu Hu (清华大学) 等 arXiv. [论文] [代码]
- [2023/05] Minecraft中的幽灵:通过大型语言模型使用文本知识和记忆开发通用能力代理 Xizhou Zhu (清华大学) 等 arXiv. [论文] [代码]
- [2023/05] RET-LLM: 面向大型语言模型的通用读写记忆 Ali Modarressi (慕尼黑大学) 等 arXiv. [论文] [代码]
- [2023/05] RecurrentGPT: 交互式生成(任意)长文本 Wangchunshu Zhou (AIWaves) 等 arXiv. [论文] [代码]
记忆检索
- [2023/08] Memory Sandbox: 面向对话代理的透明和互动记忆管理 Ziheng Huang (加州大学圣地亚哥分校) 等 arXiv. [论文]
- [2023/08] AgentSims: 一个用于大型语言模型评估的开源沙箱 Jiaju Lin (PTA Studio) 等 arXiv. [论文] [项目页面] [代码]
- [2023/06] ChatDB: 增强大型语言模型的符号记忆的数据库 Chenxu Hu (清华大学) 等 arXiv. [论文] [代码]
- [2023/05] MemoryBank: 为大型语言模型增强长期记忆 Wanjun Zhong (哈尔滨工业大学) 等 arXiv. [论文] [代码]
- [2023/04] 生成代理:人类行为的互动拟像 Joon Sung Park (斯坦福大学) 等 arXiv. [论文] [代码]
- [2023/05] RecurrentGPT: 交互式生成(任意)长文本 Wangchunshu Zhou (AIWaves) 等 arXiv. [论文] [代码]
1.1.4 推理与计划
推理
-
[2024/02] 通过逆向课程强化学习训练大型语言模型进行推理 Zhiheng Xi (复旦大学) 等 arXiv. [论文] [代码]
-
[2023/09] ReConcile: 通过多样化大型语言模型达成共识的圆桌会议提升推理能力 Justin Chih-Yao Chen (北卡罗来纳大学教堂山分校) 等 arXiv. [论文] [代码]
-
[2023/05] Self-Polish: 通过问题细化增强大型语言模型的推理能力 Zhiheng Xi (复旦大学) 等 arXiv. [论文] [代码]
-
[2023-03] 大型语言模型是零样本推理者 Takeshi Kojima (东京大学) 等 arXiv. [论文] [代码]
-
[2023/03] Self-Refine: 通过自反馈进行迭代细化 Aman Madaan (卡内基梅隆大学) 等 arXiv. [论文] [代码]
-
[2022/05] 选择-推理:利用大型语言模型进行可解释的逻辑推理 Antonia Creswell (DeepMind) 等 arXiv. [论文]
-
[2022/03] 自一致性提升大型语言模型中的链式推理 Xuezhi Wang (谷歌研究院) 等 arXiv. [论文] [代码]
-
[2023/02] 语言模型中的多模态链式推理 Zhuosheng Zhang (上海交通大学) 等 arXiv. [论文] [代码]
-
[2022/01] 链式提示引发大型语言模型中的推理 *Jason Wei (谷
-
[2023/11] JARVIS-1: 具有记忆增强多模态语言模型的开放世界多任务代理。 ZiHao Wang (北京大学) 等. arXiv. [论文] [代码]
-
[2023/10] 语言代理树搜索统一了语言模型中的推理、行动和计划。 Andy Zhou (伊利诺伊大学厄巴纳-香槟分校) 等. arXiv. [论文] [项目页面] [代码]
-
[2023/05] 思维树:利用大型语言模型进行深思熟虑的问题解决。 Shunyu Yao (普林斯顿大学) 等. arXiv. [论文] [代码]
-
[2023/05] 计划、排除和跟踪——语言模型是具身代理的优秀教师。 Yue Wu (卡内基梅隆大学) 等. arXiv. [论文]
-
[2023/05] 用世界模型进行推理即是计划。 Shibo Hao (加州大学圣地亚哥分校) 等. arXiv. [论文] [代码]
-
[2023/05] SwiftSage: 一种结合快思考和慢思考的生成性代理,用于复杂交互任务。 Bill Yuchen Lin (艾伦人工智能研究所) 等. arXiv. [论文] [代码]
-
[2023/04] LLM+P: 提升大型语言模型的最佳规划能力。 Bo Liu (德克萨斯大学奥斯汀分校) 等. arXiv. [论文] [代码]
-
[2023/03] HuggingGPT: 使用ChatGPT及其在Hugging Face中的朋友解决AI任务。 Yongliang Shen (微软亚洲研究院) 等. arXiv. [论文] [代码]
-
[2023/02] 描述、解释、计划和选择:大型语言模型的交互式规划使开放世界多任务代理成为可能。 ZiHao Wang (北京大学) 等. arXiv. [论文] [代码]
-
[2022/05] 最少到最多提示使大型语言模型能够进行复杂推理。 Denny Zhou (谷歌研究院) 等. arXiv. [论文]
-
[2022/05] MRKL系统:一种模块化的神经符号架构,结合了大型语言模型、外部知识源和离散推理。 Ehud Karpas (AI21 Labs) 等. arXiv. [论文]
-
[2022/04] 照我能做的,不照我说的:将语言与机器人可供性联系起来。 Michael Ahn (谷歌机器人) 等. arXiv. [论文]
-
[2023/05] Agents: 一个开源框架,用于自主语言代理。 Wangchunshu Zhou (AIWaves) 等. arXiv. [论文] [代码]
-
[2022/12] 不要生成,区分:一种将语言模型与现实环境联系起来的建议。 Yu Gu (俄亥俄州立大学) 等. ACL. [论文] [代码]
计划反思
- [2024/02] Agent-Pro: 通过策略层反思与优化学习进化 Wenqi Zhang (浙江大学) 等. arXiv. [论文] [代码]
- [2024/01] 自我对比:通过不一致的解决视角提升反思效果 Wenqi Zhang (浙江大学) 等. arXiv. [论文]
- [2023/11] JARVIS-1: 具有记忆增强多模态语言模型的开放世界多任务代理。 ZiHao Wang (北京大学) 等. arXiv. [论文] [代码]
- [2023/10] 验证链减少大型语言模型中的幻觉。 Shehzaad Dhuliawala (Meta AI & 苏黎世联邦理工学院) 等. arXiv. [论文]
- [2023/10] FireAct: 朝向语言代理微调。 Baian Chen (System2 Research) 等. arXiv. [论文] [项目页面] [代码] [数据集]
- [2023/08] SelfCheck: 使用大型语言模型零样本检查其自身的逐步推理。 Ning Miao (牛津大学) 等. arXiv. [论文] [代码]
- [2023/05] ChatCoT: 基于工具增强的链式思维推理在基于聊天的大型语言模型中的应用。 Zhipeng Chen (中国人民大学) 等. arXiv. [论文] [代码]
- [2023/05] Voyager: 一种大型语言模型的开放式具身代理。 Guanzhi Wang (NVIDIA) 等. arXiv. [论文] [项目页面] [代码]
- [2023/03] 与环境对话:利用大型语言模型进行交互式多模态感知。 Xufeng Zhao (汉堡大学) 等. arXiv. [论文] [代码]
- [2022/12] LLM-Planner: 具身代理的大型语言模型的少样本落地规划。 Chan Hee Song (俄亥俄州立大学) 等. arXiv. [论文] [代码]
- [2022/10] ReAct: 在语言模型中协同推理和行动。 Shunyu Yao (普林斯顿大学) 等. arXiv. [论文] [代码]
- [2022/07] 内心独白:通过语言模型的计划进行具身推理。 Wenlong Huang (谷歌机器人) 等. arXiv. [论文] [代码]
- [2021/10] AI Chains: 通过串联大型语言模型提示实现透明且可控的人机交互。 Tongshuang Wu (华盛顿大学) 等. arXiv. [[论文](https://arxiv.org/abs/2110.016
- [2023/08] 图像中的图像交流:一种用于上下文视觉学习的通用型绘画模型。 Xinlong Wang 等人,IEEE. [论文] [代码]
- Painter:该工作提出了一个面向上下文视觉学习的通用模型,采用以“图像”为中心的解决方案。
- [2023/08] 神经编解码器语言模型是零样本文本到语音合成器。 Chengyi Wang 等人,arXiv. [论文] [代码]
- VALL-E:该工作训练了一个神经编解码器语言模型,展现了上下文学习能力。
- [2023/07] 上下文学习综述。 Qingxiu Dong 等人,arXiv. [论文]
- 该综述总结了上下文学习(ICL)的进展和挑战。
- [2023/05] 语言模型是少样本学习者。 Tom B. Brown (OpenAI) 等人,NeurIPS. [论文]
- GPT-3:扩大语言模型规模极大地提升了任务无关的少样本性能,有时甚至可以与以前的最先进微调方法竞争。
持续学习
- [2023/11] JARVIS-1:带有记忆增强多模态语言模型的开放世界多任务代理。 ZiHao Wang (北京大学) 等人,arXiv. [论文] [代码]
- [2023/07] 渐进提示:语言模型的持续学习。 Razdaibiedina 等人,arXiv. [论文]
- 该工作引入了渐进提示,它允许前向迁移并抵抗灾难性遗忘,而不依赖数据重放或大量任务特定参数。
- [2023/05] Voyager:一个带有大语言模型的开放式化身代理。 Guanzhi Wang (NVIDIA) 等人,arXiv. [论文] [项目页面] [代码]
- Voyager:这是一个在Minecraft中由LLM驱动的化身终身学习代理,能够不断探索世界,获取多样化的技能,并在没有人为干预的情况下做出新的发现。
- [2023/01] 持续学习的全面综述:理论、方法和应用。 Liyuan Wang 等人,arXiv. [论文]
- 该综述提出了对持续学习的全面综述,旨在弥合基本设置、理论基础、代表性方法和实际应用之间的差距。
- [2022/11] 自然语言处理任务的持续学习:一项综述。 Zixuan Ke 等人,arXiv. [论文]
- 该综述对自然语言处理领域持续学习的最新进展进行了全面回顾和分析。
1.2 感知:LLM代理的多模态输入
1.2.1 视觉
- [2024/01] Agent ai:多模态交互的前景展望综述。 Zane Durante 等人,arXiv. [论文]
- [2023/10] 通过多模态大语言模型实现端到端的化身决策:GPT4-Vision及其扩展。 Liang Chen 等人,arXiv. [论文] [代码]
- [2023/05] 语言不是你所需的全部:将感知与语言模型对齐。 Shaohan Huang 等人,arXiv. [论文]
- [2023/05] InstructBLIP:通过指令微调迈向通用视觉语言模型。 Wenliang Dai 等人,arXiv. [论文]
- [2023/05] MultiModal-GPT:一个与人类对话的视觉与语言模型。 Tao Gong 等人,arXiv. [论文]
- [2023/05] PandaGPT:一个模型应对所有指令。 Yixuan Su 等人,arXiv. [论文]
- [2023/04] 视觉指令微调。 Haotian Liu 等人,arXiv. [论文]
- [2023/04] MiniGPT-4:通过先进的大型语言模型增强视觉语言理解。 Deyao Zhu,arXiv. [论文]
- [2023/01] BLIP-2:通过冻结的图像编码器和大型语言模型引导语言-图像预训练。 Junnan Li 等人,arXiv. [论文]
- [2022/04] Flamingo:用于少样本学习的视觉语言模型。 Jean-Baptiste Alayrac 等人,arXiv. [论文]
- [2021/10] MobileViT:轻量级、通用且适用于移动设备的视觉Transformer。 Sachin Mehta 等人,arXiv. [论文]
- [2021/05] MLP-Mixer:一种全MLP架构的视觉模型。 Ilya Tolstikhin 等人,arXiv. [论文]
- [2020/10] 一幅图像值千言:用于图像识别的Transformer。 Alexey Dosovitskiy 等人,arXiv. [论文]
- [2017/11] 神经离散表示学习。 Aaron van den Oord 等人,arXiv. [论文]
1.2.2 音频
- [2023/06] Video-LLaMA:一个用于视频理解的指令微调音视频语言模型。 Hang Zhang 等人,arXiv. [论文]
- [2023/05] X-LLM:通过将多模态视为外语引导高级大语言模型。 Feilong Chen 等人,arXiv. [论文]
- [2023/05] InternGPT:通过与ChatGPT的交互解决以视觉为中心的任务。 Zhaoyang Liu 等人,arXiv. [论文]
- [2023/04] AudioGPT:理解并生成语音、音乐、声音和说话头。 Rongjie Huang 等人,arXiv. [论文]
- [2023/03] HuggingGPT:通过ChatGPT及其在Hugging Face中的朋友解决AI任务。 Yongliang Shen 等人,arXiv. [论文]
- [2021/06] HuBERT:通过掩码预测隐藏单元进行自监督语音表示学习。 Wei-Ning Hsu 等人,arXiv. [论文]
- [2021/04] AST:音频频谱图Transformer。 *Yuan Gong 等
1.3.1 工具使用
- [2024/02] 面向不确定性感知语言代理。 韩九州(蒙纳士大学)等人 arXiv. [论文] [项目页面] [代码]
- [2023/10] OpenAgents:一个用于现实环境中的语言代理的开放平台。 XLang Lab(香港大学)arXiv. [论文] [项目页面] [代码] [演示]
- [2023/10] Lemur:协调自然语言和代码以实现语言代理 许怡恒(香港大学)等人 arXiv. [论文] [代码]
- [2023/10] 通过多模态大型语言模型实现端到端具身决策:使用GPT4-Vision及其扩展的探索 陈亮(北京大学)等人 arXiv. [论文] [代码]
- HOLMES是一个多代理合作框架,允许LLM利用MLLM和API收集多模态信息以进行知情决策。
- [2023/07] ToolLLM:帮助大型语言模型掌握16000多个现实世界API。 秦宇佳(清华大学)等人 arXiv. [论文] [代码] [数据集]
- ToolLLM是一个包含数据构建、模型训练和评估的通用工具使用框架。
- [2023/05] 作为工具制造者的大型语言模型。 蔡天乐(普林斯顿大学)等人 arXiv. [论文] [代码]
- LATM是一个闭环框架,初步实现了去除对现有工具的依赖。
- [2023/05] CREATOR:通过工具创建分离大型语言模型的抽象与具体推理能力。 钱成(清华大学)等人 arXiv. [论文]
- CREATOR是一个新颖框架,赋能LLM通过文档编写和代码实现创建自己的工具。
- [2023/04] 使用基础模型进行工具学习。 秦宇佳(清华大学)等人 arXiv. [论文] [代码]
- 该综述主要介绍了一种新的范式,称为“基于基础模型的工具学习”,该范式结合了专业工具和基础模型的优势,实现了更高的精度、效率和自动化问题解决能力。
- [2023/04] ChemCrow:通过化学工具增强大型语言模型。 Andres M Bran(人工化学智能实验室,ISIC,EPFL)等人 arXiv. [论文] [代码]
- ChemCrow是一个整合了13个专家设计工具的LLM化学代理,它增强了LLM在化学领域的表现并产生了新能力。
- [2023/04] GeneGPT:通过领域工具增强大型语言模型以改进生物医学信息访问。 金桥(美国国立卫生研究院),杨一凡,陈青宇,陆志勇 arXiv. [论文] [代码]
- GeneGPT是一个回答基因组学问题的模型。它引入了一种新方法,通过教导LLM使用Web API来处理幻觉问题。
- [2023/04] OpenAGI:当LLM遇到领域专家。 葛英强(罗格斯大学)等人 arXiv. [论文] [代码]
- OpenAGI是一个开源的AGI研究平台。它引入了LLM操作各种专家模型以解决复杂任务的范式,并提出了一种RLTF机制,以提高LLM的任务解决能力。
- [2023/03] HuggingGPT:使用ChatGPT及其在Hugging Face中的伙伴解决AI任务。 沈永良(浙江大学)等人 arXiv. [论文] [代码]
- HuggingGPT是一个利用LLM连接机器学习社区中的各种多模态AI模型来解决AI任务的系统。
- [2023/03] Visual ChatGPT:与视觉基础模型对话、绘画和编辑。 吴辰飞(微软亚洲研究院)等人 arXiv. [论文] [代码]
- Visual ChatGPT是一个系统,借助视觉基础模型探索了ChatGPT的视觉角色。
- [2023/02] 增强语言模型:一个综述。 Grégoire Mialon(Meta AI)等人 TMLR. [论文]
- 该综述回顾了增强LM使用工具的相关工作。增强LM可以使用外部模块来扩展其上下文处理能力。
- [2023/02] Toolformer:语言模型可以自学使用工具。 Timo Schick(Meta AI)等人 arXiv. [论文]
- Toolformer展示了LLM如何通过为每个API提供少量示例来自学使用外部工具。
- [2022/05] TALM:工具增强的语言模型。 Aaron Parisi(Google)等人 arXiv. [论文]
- TALM介绍了一种将非可微工具与LM结合的方法,使模型能够访问实时或私人数据。
- [2022/05] MRKL系统:一种模块化的、神经符号架构,结合了大型语言模型、外部知识来源和离散推理。 Ehud Karpas(AI21 Labs)等人 arXiv. [论文]
- MRKL系统通过可扩展的外部知识和推理模块增强了LLM。
- [2022/04] 照我能做的,不是我说的做:将语言与机器人可操作性相结合。 Michael Ahn(Google)等人 CoRL. [论文]
- SayCan通过结合LLM的高级语义知识与预训练技能的价值函数,将LM应用于实际的机器人任务中。
- [2021/12] WebGPT:通过人类反馈进行浏览器辅助问答。 Reiichiro Nakano(OpenAI)等人 arXiv. [论文]
- WebGPT使用浏览器环境来回答问题。在训练过程中,它使用模仿学习,然后通过人类反馈优化回答质量。
- [2021/07] 评估训练在代码上的大型语言模型。 Mark Chen(OpenAI)等人 arXiv. [论文] [代码]
- Codex可以从文档字符串中合成程序,即根据文档创建工具。
1.3.2 具身行动
- [2023/12] 迈向学习具身导航的通用模型。 Duo Zheng(香港中文大学)等。arXiv. [论文] [代码]
- [2023/11] 三维世界中的具身通用代理。 Jiangyong Huang(BIGAI & 北京大学)等。arXiv. [论文] [项目页面]
- [2023/11] JARVIS-1:具备记忆增强的多模态语言模型的开放世界多任务代理。 ZiHao Wang(北京大学)等。arXiv. [论文] [代码]
- [2023/10] Lemur:为语言代理和谐自然语言与代码。 Yiheng Xu(香港大学)等。arXiv. [论文] [代码]
- [2023/10] 通过多模态大型语言模型迈向端到端具身决策:探索GPT4-Vision及其应用。 Liang Chen 等。arXiv. [论文] [代码]
- [2023/07] 互动语言:与机器人实时对话。 Corey Lynch 等。IEEE (RAL) [论文]
- [2023/05] Voyager:一个使用大型语言模型的开放式具身代理。 Guanzhi Wang(NVIDIA)等。arXiv. [论文] [项目页面] [代码]
- [2023/05] AVLEN:三维环境中的音频-视觉-语言具身导航。 Sudipta Paul 等。NeurIPS. [论文]
- [2023/05] EmbodiedGPT:通过具身思维链进行视觉-语言预训练。 Yao Mu 等。arXiv [论文] [代码]
- [2023/05] NavGPT:使用大型语言模型在视觉-语言导航中进行显式推理。 Gengze Zhou 等。arXiv [论文]
- [2023/05] AlphaBlock:用于机器人操作中的视觉-语言推理的具身微调。 Chuhao Jin 等。arXiv [论文]
- [2023/03] PaLM-E:一个具身的多模态语言模型。 Danny Driess 等。arXiv. [论文]
- [2023/03] Reflexion:带有言语强化学习的语言代理。 Noah Shinn 等。arXiv [论文] [代码]
- [2023/02] 与语言模型协作进行具身推理。 Ishita Dasgupta 等。arXiv. [论文]
- [2023/02] 代码即政策:用于具身控制的语言模型程序。 Jacky Liang 等。IEEE (ICRA). [论文]
- [2022/10] ReAct:在语言模型中协调推理与行动。 Shunyu Yao 等。arXiv [论文] [代码]
- [2022/10] 使用多模态Transformer的指令跟随代理。 Hao Liu 等。CVPR [论文] [代码]
- [2022/07] 内心独白:通过规划和语言模型进行具身推理。 Wenlong Huang 等。arXiv. [论文]
- [2022/07] LM-Nav:使用大型预训练语言、视觉和行动模型的机器人导航。 Dhruv Shah 等。CoRL [论文] [代码]
- [2022/04] 照我能做的做,而非照我说的做:将语言落地于机器人可供性。 Michael Ahn 等。arXiv. [论文]
- [2022/01] 具身人工智能综述:从模拟器到研究任务。 Jiafei Duan 等。IEEE (TETCI). [论文]
- [2022/01] 语言模型作为零样本规划者:为具身代理提取可操作知识。 Wenlong Huang 等。arXiv. [论文] [代码]
- [2020/04] 经验奠定语言基础。 Yonatan Bisk 等。EMNLP [论文]
- [2019/03] 机器人操作的深度强化学习综述。 Hai Nguyen 等。IEEE (IRC). [论文]
- [2005/01] 具身认知的发展:来自婴儿的六个教训。 Linda Smith 等。Artificial Life. [论文]
2. 实践中的代理:基于LLM的代理的应用
2.1 单一代理的一般能力
2.1.1 面向任务的部署
在网页场景中
-
[2023/10] OpenAgents:一个用于真实环境中语言代理的开放平台。 XLang Lab(香港大学)arXiv. [论文] [项目页面] [代码] [演示]
-
[2023/07] WebArena:一个用于构建自主代理的真实网页环境。 Shuyan Zhou(卡内基梅隆大学)等。arXiv. [论文] [代码]
-
[2023/07] 具有规划、长上下文理解和程序合成能力的真实世界WebAgent。 Izzeddin Gur(DeepMind)等。arXiv. [论文]
-
[2023/06] SYNAPSE:利用少样本示例进行人类水平的计算机控制。 *Longtao Zheng(南洋理工 生活场景中
-
[2023/10] OpenAgents: 一个用于真实环境中语言代理的开放平台。 XLang Lab (香港大学) arXiv. [论文] [项目页面] [代码] [演示]
-
[2023/08] InterAct: 探索ChatGPT作为合作代理的潜力。 Po-Lin Chen 等 arXiv. [论文]
-
[2023/05] 计划、消除和跟踪——语言模型是体现代理的优秀教师。 Yue Wu (卡内基梅隆大学) 等 arXiv. [论文]
-
[2023/05] 通过大型语言模型增强自我导向代理。 Cédric Colas (麻省理工学院) 等 arXiv. [论文]
-
[2023/03] 通过纠正性重新提示进行大语言模型的规划。 Shreyas Sundara Raman (布朗大学) 等 arXiv. [论文]
-
[2022/10] 生成具有环境意识的语言模型的可执行行动计划。 Maitrey Gramopadhye (北卡罗来纳大学教堂山分校) 等 arXiv. [论文] [代码]
-
[2022/01] 语言模型作为零样本规划者:为具体现代理提取可操作的知识。 Wenlong Huang (加州大学伯克利分校) 等 arXiv. [论文] [代码]
2.1.2 面向创新的部署
- [2023/10] OpenAgents: 一个用于真实环境中语言代理的开放平台。 XLang Lab (香港大学) arXiv. [论文] [项目页面] [代码] [演示]
- [2023/08] 程序分析指南:与大型语言模型的旅程。 Haonan Li (加州大学河滨分校) 等 arXiv. [论文]
- [2023/08] ChatMOF: 一个用于预测和生成金属有机框架的自主AI系统。 Yeonghun Kang (韩国科学技术院) 等 arXiv. [论文]
- [2023/07] 数学代理:计算基础设施、数学嵌入与基因组学。 Melanie Swan (伦敦大学学院) 等 arXiv. [论文]
- [2023/06] 面向自主测试代理的对话式大语言模型。 Robert Feldt (查尔姆斯理工大学) 等 arXiv. [论文]
- [2023/04] 大型语言模型的自主科学研究能力。 Daniil A. Boiko (卡内基梅隆大学) 等 arXiv. [论文]
- [2023/04] ChemCrow: 使用化学工具增强大型语言模型。 Andres M Bran (人工化学智能实验室, EPFL) 等 arXiv. [论文] [代码]
- [2022/03] ScienceWorld: 你的代理比五年级学生更聪明吗? Ruoyao Wang (亚利桑那大学) 等 arXiv. [论文] [代码]
2.1.3 生命周期导向的部署
- [2023/05] Voyager: 一个使用大型语言模型的开放式体现代理。 Guanzhi Wang (英伟达) 等 arXiv. [论文] [项目页面] [代码]
- [2023/05] Minecraft中的幽灵:通过具有文本知识和记忆的语言模型实现开放世界环境中普适代理。 Xizhou Zhu (清华大学) 等 arXiv. [论文] [代码]
- [2023/03] Plan4MC: 面向开放世界Minecraft任务的技能强化学习与规划。 Haoqi Yuan (北京大学) 等 arXiv. [论文] [项目页面]
- [2023/02] 描述、解释、计划与选择:互动规划中的大型语言模型使能开放世界多任务代理。 Zihao Wang (北京大学) 等 arXiv. [论文] [代码]
- [2023/01] 具体现代理梦见像素化的羊:使用语言指导的世界建模进行体现决策。 Kolby Nottingham (加州大学欧文分校) 等 arXiv. [论文] [代码]
2.2 多代理协调潜力
2.2.1 互补性的合作互动
无序合作
-
[2023/07] 在大型语言模型中释放认知协同效应:通过多角色自我合作的任务解决代理。 Zhenhailong Wang (伊利诺伊大学厄巴纳-香槟分校) 等 arXiv. [论文] [代码]
-
[2023/07] RoCo: 通过大型语言模型实现方言式多机器人协作。 Zhao Mandi, Shreeya Jain, Shuran Song (哥伦比亚大学) 等 arXiv. [论文] [代码]
-
[2023/04] ChatLLM网络:更多大脑,更多智慧。 Rui Hao (北京邮电大学) 等 arXiv. [论文]
-
[2023/01] 盲目判断:基于代理的GPT最高法院建模。 Sil Hamilton (麦吉尔大学) arXiv. [论文]
-
[2023/05] Agents: 一个用于自主语言代理的开源框架。 Wangchunshu Zhou (AIWaves) 等 arXiv. [论文] [代码] 有序合作
-
[2023/08] CGMI:可配置通用多代理交互框架。 施锦鑫(华东师范大学)等,arXiv。 [论文]
-
[2023/08] ProAgent:利用大语言模型构建主动合作AI。 张策耀(香港中文大学深圳)等,arXiv。 [论文] [代码]
-
[2023/08] AgentVerse:促进多代理协作与探索代理的涌现行为。 陈炜泽(清华大学)等,arXiv。 [论文] [代码]
-
[2023/08] AutoGen:通过多代理对话框架实现下一代LLM应用。 吴庆云(宾夕法尼亚州立大学)等,arXiv。 [论文] [代码]
-
[2023/08] MetaGPT:元编程用于多代理协作框架。 洪思睿(DeepWisdom)等,arXiv。 [论文] [代码]
-
[2023/06] 多代理协作:利用智能LLM代理的力量。 Yashar Talebira(阿尔伯塔大学)等,arXiv。 [论文]
-
[2023/05] 在模拟人类社会中训练社会对齐的语言模型。 刘瑞波(达特茅斯学院)等,arXiv。 [论文] [代码]
-
[2023/05] SwiftSage:一个具有快思考和慢思考的生成代理,用于复杂互动任务。 林煜宸(艾伦人工智能研究所)等,arXiv。 [论文] [代码]
-
[2023/05] ChatGPT作为你的个人数据科学家。 Md Mahadi Hassan(奥本大学)等,arXiv。 [论文]
-
[2023/03] CAMEL:用于大规模语言模型社会的“思维”探索的通信代理。 李国豪(阿卜杜拉国王科技大学)等,arXiv。 [论文] [代码]
-
[2023/03] DERA:通过对话启用的解决代理增强大语言模型补全。 Varun Nair(Curai Health)等,arXiv。 [论文] [代码]
-
[2023/04] 通过ChatGPT实现自我合作代码生成。 董奕泓(北京大学)等,arXiv。 [论文]
2.2.2 为进步而进行的对抗性互动
- [2023/08] ChatEval:通过多代理辩论提升LLM评估器的质量。 陈智敏(清华大学)等,arXiv。 [论文] [代码]
- [2023/05] 通过多代理辩论提高语言模型的真实性和推理能力。 杜依伦(麻省理工学院CSAIL实验室)等,arXiv。 [论文] [代码]
- [2023/05] 通过自我博弈和AI反馈的上下文学习提升语言模型的谈判能力。 傅曜(爱丁堡大学)等,arXiv。 [论文] [代码]
- [2023/05] 审查大语言模型的一致性:通过辩论进行深入分析。 熊凯(哈尔滨工业大学)等,arXiv。 [论文]
- [2023/05] 通过多代理辩论鼓励大语言模型的发散思维。 梁天(清华大学)等,arXiv。 [论文] [代码]
2.3 人类与代理的互动参与
2.3.1 指导者-执行者范式
教育
- [2023/07] 数学代理:计算基础设施、数学嵌入和基因组学。 Melanie Swan(伦敦大学学院)等,arXiv。 [论文]
- 与人类沟通以帮助他们理解和使用数学。
- [2023/03] 嘿 Dona!你能帮我注册学生课程吗? Vishesh Kalvakurthi(密歇根州立大学)等,arXiv。 [论文]
- 这是一个名为Dona的开发应用程序,提供学生课程注册的虚拟语音助手,人类提供指令。
健康
- [2023/08] 仲景:通过专家反馈和真实世界多轮对话提升大语言模型的中医能力。 杨松华(郑州大学)等,arXiv。 [论文] [代码]
- [2023/05] 华佗GPT:驯服语言模型成为医生。 张宏波(香港中文大学深圳)等,arXiv。 [论文] [代码] [演示]
- [2023/05] 帮助帮助者:通过AI赋能的实践和反馈支持同伴辅导员。 许尚岭(佐治亚理工学院)等,arXiv。 [论文]
- [2020/10] 为自闭症谱系障碍青少年设计的虚拟对话代理:实验结果与设计经验。 Mohammad Rafayet Ali(罗切斯特大学)等,IVA '20。 [论文]
其他应用
- [2023/08] **RecMind:大语言模型驱
- [2023/08] 量化大型语言模型对集体意见动态的影响。 Chao Li 等人. CoRR. [论文]
- [2023/06] 通过人类正则化强化学习和规划掌握无对话外交游戏。 Anton Bakhtin 等人. ICLR. [论文]
- [2023/06] 面向人机协作的决策导向对话。 Jessy Lin 等人. CoRR. [论文]
- [2022/11] 通过结合语言模型和战略推理在外交游戏中达到人类水平的表现。 FAIR 等人. Science. [论文]
3. Agent Society: 从个体到社会
3.1 基于大型语言模型代理的行为与个性
3.1.1 社会行为
个体行为
- [2023/10] Lyfe Agents: 用于低成本实时社交互动的生成代理。 赵凯雅 (麻省理工学院) 等人. arXiv. [论文]
- [2023/05] Voyager: 一个开端式具身代理,结合大型语言模型。 王冠之 (英伟达) 等人. arXiv. [论文] [代码] [项目页面]
- [2023/04] LLM+P: 赋能大型语言模型以最佳规划能力。 刘博 (德克萨斯大学) 等人. arXiv. [论文] [代码]
- [2023/03] Reflexion: 具备语言强化学习的语言代理。 Noah Shinn (东北大学) 等人. arXiv. [论文] [代码]
- [2023/03] PaLM-E: 一个具身多模态语言模型。 Danny Driess (谷歌) 等人. ICML. [论文] [项目页面]
- [2023/03] ReAct: 在语言模型中协同推理与行动。 姚顺玉 (普林斯顿大学) 等人. ICLR. [论文] [项目页面]
- [2022/01] 链式思维提示引发大型语言模型中的推理。 Jason Wei (谷歌) 等人. NeurIPS. [论文]
群体行为
-
[2023/10] 探讨LLM代理的协作机制: 从社会心理学视角出发。 张金天 (浙江大学) 等人. arXiv. [论文] [代码]
-
[2023/09] MindAgent: 新兴的游戏交互。 龚然 (加州大学洛杉矶分校) 等人. arXiv. [论文] [代码]
-
[2023/09] 探索大型语言模型在交流游戏中的应用: 对狼人杀的实证研究。 徐玉庄 (清华大学) 等人. arXiv. [论文]
-
[2023/09] 怀疑代理: 利用具备心智理论的GPT-4进行不完美信息游戏。 顾嘉贤 等人. arXiv. [论文]
-
[2023/08] AgentVerse: 促进多代理协作并探索代理中的新兴行为。 陈维泽 (清华大学) 等人. arXiv. [论文] [代码]
-
[2023/08] AutoGen: 通过多代理对话框架支持下一代LLM应用。 吴清云 (宾夕法尼亚州立大学) 等人. arXiv. [论文] [代码]
-
[2023/08] ChatEval: 通过多代理辩论提升基于LLM的评估器。 陈启民 (清华大学) 等人. arXiv. [论文] [代码]
-
[2023/07] RoCo: 利用大型语言模型进行多机器人合作对话。 赵曼迪, Shreeya Jain, 宋舒然 (哥伦比亚大学) 等人. arXiv. [论文] [代码]
-
[2023/08] ProAgent: 利用大型语言模型构建主动合作AI。 张策耀 (香港中文大学深圳) 等人. arXiv. [论文] [代码]
-
[2023/06] 同质性在大型语言模型代理人工社会网络中的表现。 James K. He (剑桥大学) 等人. PsyArXiv. [论文]
3.1.2 个性
认知
- [2023/09] 怀疑代理: 利用具备心智理论的GPT-4进行不完美信息游戏。 顾嘉贤 等人. arXiv. [论文]
- [2023/03] 机器心理学: 使用心理学方法研究大型语言模型的能力与行为。 Thilo Hagendorff (斯图加特大学) 等人. arXiv. [论文]
- [2023/03] 心智与机器: 揭开GPT-4认知心理学的面纱。 Sifatkaur Dhingra (Nowrosjee Wadia学院) 等人. arXiv. [论文]
- [2022/07] 语言模型在推理中的人类内容效应表现。 Ishita Dasgupta (DeepMind) 等人. arXiv. [论文]
- [2022/06] 使用认知心理学理解GPT-3。 Marcel Binz 等人. arXiv. [论文]
情感
- [2023/07] 大型语言模型的情商。 王雪娜 (清华大学) 等人. arXiv. [论文]
- [2023/05] 在情感意识评估中ChatGPT表现优于人类。 Zohar Elyoseph 等人. Frontiers in Psychology. [[论文](https://www.frontiersin
- [2023/08] Hoodwinked: Deception and Cooperation in a Text-Based Game for Language Models. Aidan O’Gara (University of Southern California) 等. arXiv. [论文] [代码]
- [2023/03] CAMEL: 用于“大规模语言模型社会”心智探索的交流代理. Guohao Li (King Abdullah University of Science and Technology) 等. arXiv. [论文] [代码]
- [2020/12] 用常识玩文本冒险游戏. Sahith Dambekodi (Georgia Institute of Technology) 等. arXiv. [论文]
- [2019/09] 互动小说游戏:一个庞大的冒险. Matthew Hausknecht (Microsoft Research) 等. AAAI. [论文] [代码]
- [2019/03] 学习在幻想文本冒险游戏中说话和行动. Jack Urbanek (Facebook) 等. ACL. [论文] [代码]
- [2018/06] TextWorld:文本游戏的学习环境. Marc-Alexandre Côté (Microsoft Research) 等. IJCAI. [论文] [代码]
3.2.2 虚拟沙盒环境
- [2023/11] JARVIS-1: 带有记忆增强多模态语言模型的开放世界多任务代理. ZiHao Wang (Peking University) 等. arXiv. [论文] [代码]
- [2023/10] Humanoid Agents: 类人生成代理模拟平台. Zhilin Wang (University of Washington and NVIDIA) 等. arXiv. [论文] [代码] [演示]
- [2023/08] AgentSims: 一个开源的用于大语言模型评估的沙盒. Jiaju Lin (PTA Studio) 等. arXiv. [论文] [项目页面] [代码]
- [2023/05] 在模拟人类社会中训练社会对齐的语言模型. Ruibo Liu (Dartmouth College) 等. arXiv. [论文] [代码]
- [2023/05] Voyager: 一个带有大语言模型的开放式实体代理. Guanzhi Wang (NVIDIA) 等. arXiv. [论文] [项目页面] [代码]
- [2023/04] 生成代理:人类行为的互动仿真. Joon Sung Park (Stanford University) 等. arXiv. [论文] [代码]
- [2023/03] Plan4MC: 用于开放世界Minecraft任务的技能强化学习和规划. Haoqi Yuan (PKU) 等. arXiv. [论文] [项目页面]
- [2022/06] MineDojo: 利用互联网规模的知识构建开放式实体代理. Linxi Fan (NVIDIA) 等. NeurIPS. [论文] [项目页面]
3.2.3 物理环境
- [2023/11] 3D世界中的实体通用代理. Jiangyong Huang (BIGAI & Peking University) 等. arXiv. [论文] [项目页面]
- [2023/09] RoboAgent: 通过语义增强和动作分块实现机器人操作的泛化和效率. Homanga Bharadhwaj (Carnegie Mellon University) 等. arXiv. [论文] [项目页面]
- [2023/05] AVLEN: 在3D环境中的音视频语言实体导航. Sudipta Paul 等. NeurIPS. [论文]
- [2023/03] PaLM-E: 一个实体多模态语言模型. Danny Driess (Google) 等. ICML. [论文] [项目页面]
- [2022/10] 互动语言:实时与机器人对话. Corey Lynch (Google) 等. arXiv. [论文] [代码]
3.3 基于LLM的代理社会模拟
- [2024/03] 基于大语言模型的代理社会中的社会规范的出现. Siyue Ren 等. arXiv. [论文] [代码]
- [2023/08] AgentSims: 一个开源的用于大语言模型评估的沙盒. Jiaju Lin (PTA Studio) 等. arXiv. [论文] [项目页面] [代码]
- [2023/07] S3: 带有大语言模型赋能代理的社交网络模拟系统. Chen Gao (Tsinghua University) 等. arXiv. [论文]
- [2023/07] 用生成代理进行流行病建模. Ross Williams (Virginia Tech) 等. arXiv. [论文] [代码]
- [2023/06] RecAgent: 为推荐系统设立的新模拟范式. Lei Wang (Renmin University of China) 等. arXiv. [论文]
- [2023/05] 在模拟人类社会中训练社会对齐的语言模型. Ruibo Liu (Dartmouth College) 等. arXiv. [论文] [代码]
- [2023/04] 生成代理:人类行为的互动仿真. Joon Sung Park (Stanford University) 等. arXiv. [论文] [代码]
- [2022/08] 社交仿真:为社交计算系统创建填充原型. Joon Sung Park (Stanford University) 等. UIST. [[论文](https://dl.acm.org/doi/10.1145/3526113.354561
4.2 基于大型语言模型的代理的训练和优化
- [2024/06] AgentGym: 在多样化环境中进化大型语言模型代理。 Zhiheng Xi (复旦大学) 等人. arXiv. [论文] [项目页面] [代码和平台] [数据集] [基准] [模型]。
- [2023/10] FireAct: 迈向语言代理微调。 Baian Chen (System2 Research) 等人. arXiv. [论文] [项目页面] [代码] [数据集]
- [2023/10] AgentTuning: 为大型语言模型赋能通用代理能力。 Aohan Zeng (清华大学) 等人. arXiv. [论文] [项目页面] [代码] [数据集]
- [2023/10] Lemur: 为语言代理调和自然语言与代码 Yiheng Xu (香港大学) 等人. arXiv. [论文] [代码]
引用
如果您发现此存储库有用,请引用我们的论文:
@misc{xi2023rise,
title={The Rise and Potential of Large Language Model Based Agents: A Survey},
author={Zhiheng Xi and Wenxiang Chen and Xin Guo and Wei He and Yiwen Ding and Boyang Hong and Ming Zhang and Junzhe Wang and Senjie Jin and Enyu Zhou and Rui Zheng and Xiaoran Fan and Xiao Wang and Limao Xiong and Yuhao Zhou and Weiran Wang and Changhao Jiang and Yicheng Zou and Xiangyang Liu and Zhangyue Yin and Shihan Dou and Rongxiang Weng and Wensen Cheng and Qi Zhang and Wenjuan Qin and Yongyan Zheng and Xipeng Qiu and Xuanjing Huang and Tao Gui},
year={2023},
eprint={2309.07864},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
项目维护者和贡献者
- Zhiheng Xi (奚志恒, @WooooDyy)
- Wenxiang Chen (陈文翔, @chenwxOggai)
- Xin Guo (郭昕, @XinGuo2002)
- Wei He(何为, @hewei2001)
- Yiwen Ding (丁怡文, @Yiwen-Ding)
- Boyang Hong(洪博杨, @HongBoYang)
- Ming Zhang (张明, @KongLongGeFDU)
- Junzhe Wang(王浚哲, @zsxmwjz)
- Senjie Jin(金森杰, @Leonnnnnn929)
联系方式
- Zhiheng Xi: zhxi22@m.fudan.edu.cn