#规划

LLM-Planning-Papers - 大型语言模型规划能力研究论文精选
LLM计划能力规划Embodied Agents非监督学习Github开源项目
本文档收录了关于大型语言模型(LLMs)规划能力的多篇研究论文,涵盖零样本规划、复杂推理、多模态程序规划和交互规划等领域。读者可以获得每篇论文的详细摘要、代码链接及其会议信息,如ICML、ICLR、AAAI和NeurIPS。这是研究和应用LLMs任务规划的必备资源,帮助学者和开发者了解最新进展和应用案例。
Awesome-LLM-Robotics - 机器人和人工智能融合的前沿研究资源汇编
大语言模型机器人规划推理人工智能Github开源项目
该资源列表汇编了大型语言模型和多模态模型在机器人和强化学习领域的最新研究成果。内容涵盖推理、规划、操作、指令和导航等方面,并包括相关模拟框架。这一综合性参考资料有助于研究人员和开发者探索人工智能与机器人技术的融合前沿。
GameFormer - 结合游戏理论的自动驾驶交互预测规划模型
GameFormer自动驾驶交互预测规划TransformerGithub开源项目
GameFormer是一个创新的自动驾驶AI项目,结合游戏理论和Transformer架构进行交互式预测和规划。项目提供Waymo开放运动数据集上的交互预测联合模型代码,以及动态场景的开环规划实现。GameFormer提高了预测准确性和自动驾驶系统的决策能力,为智能交通系统研究开辟新方向。
TravelPlanner - 真实世界规划的语言代理基准测试
TravelPlanner语言代理规划工具使用基准测试Github开源项目
TravelPlanner是一个评估语言代理在真实世界规划能力的基准测试。该项目模拟旅行规划场景,要求语言代理根据查询制定包含交通、餐饮、景点和住宿的完整计划。通过设置环境、常识和硬性约束,TravelPlanner全面测试语言模型的规划能力。项目提供两阶段和单一规划两种模式,支持多种语言模型,并配备详细的评估方法和工具。
LLMs-Planning - 大型语言模型规划与推理能力评估与分析工具
LLM规划评估基准测试人工智能Github开源项目
LLMs-Planning项目包含PlanBench和大型语言模型规划能力分析两个子项目。PlanBench提供可扩展的基准测试,用于评估大型语言模型在规划和推理变化方面的表现。项目还对大型语言模型的规划能力进行了批判性调查,为自然语言处理和人工智能规划领域的研究者提供了重要参考。