#AgentGym
相关项目
LLM-Agent-Paper-List
该项目研究基于大型语言模型的智能代理,从核心构建到多模态输入及行动扩展提供全面分析。研究重点包括单代理和多代理的协作场景及与人类互动,探讨智能代理在多种应用领域的潜力及面临的挑战,旨在开拓通用人工智能(AGI)建设的新途径。
AgentGym
AgentGym是一个框架,通过多种交互环境和统一任务格式,协助科研人员评估和开发具备广泛能力的语言模型智能体。平台支持实时反馈和并发操作,包含14种环境,如网页导航、文字游戏和家务任务。核心组成包括高质量的轨迹集AgentTraj和基准测试套件AgentEval,并提出了智能体自我进化方法AgentEvol。实验结果显示,进化后的智能体可与当前最先进的模型媲美。