#工具使用
相关项目
langchain-benchmarks
提供多种LLM任务基准测试工具,涵盖数据集收集、任务评估等全流程。依赖LangSmith平台,附有详细文档和实例,鼓励用户优化和测试解决方案。
trex
Trex是一款将非结构化数据转换为结构化数据的工具。通过指定正则表达式或上下文无关语法,Trex能智能地调整数据以符合指定的架构。用户可以通过Python客户端和API密钥,在云端或本地系统中进行自托管。Trex具备结构化JSON生成、自定义CFG生成和正则生成等功能,且处理速度显著提升,并有明确的开发计划,以满足更多智能模型需求。
swarms
Swarms是一个企业级生产就绪的多代理协作框架,旨在简化多代理的协调过程,提供可靠的自动化解决方案。它支持多种LLM和框架,具有高度定制化能力,并提供长时记忆数据库功能。Swarms适用于在现实世界中执行各种自动化任务,包括长文档理解、分析和检索,通过丰富的工具完成各种数字化任务。
Qwen-Agent
Qwen-Agent是基于通义千问大语言模型的应用开发框架。该框架提供指令跟随、工具使用、规划和记忆等功能,包含浏览器助手和代码解释器等示例应用。它支持自定义工具开发,提供原子级和高级组件,能处理超长文档问答,并在多个基准测试中表现出色。开发者可以利用Qwen-Agent创建智能助手,实现复杂的人工智能应用。
TravelPlanner
TravelPlanner是一个评估语言代理在真实世界规划能力的基准测试。该项目模拟旅行规划场景,要求语言代理根据查询制定包含交通、餐饮、景点和住宿的完整计划。通过设置环境、常识和硬性约束,TravelPlanner全面测试语言模型的规划能力。项目提供两阶段和单一规划两种模式,支持多种语言模型,并配备详细的评估方法和工具。