#工具使用

Qwen-Agent: 打造智能助手的强大框架

3 个月前

Qwen-Agent LLM应用代理框架工具使用自定义助手 Github 开源项目

3 个月前

Swarms - 未来智能体协作的革命性框架

3 个月前

Swarms 多代理协同自主代理长期记忆数据库工具使用 Github 开源项目

3 个月前

LangChain Benchmarks: 为LLM相关任务提供基准测试的开源工具包

3 个月前

LangChain Benchmarks LangSmith 基准测试 LLM任务工具使用 Github 开源项目

3 个月前

相关项目

langchain-benchmarks

提供多种LLM任务基准测试工具，涵盖数据集收集、任务评估等全流程。依赖LangSmith平台，附有详细文档和实例，鼓励用户优化和测试解决方案。

trex

Trex是一款将非结构化数据转换为结构化数据的工具。通过指定正则表达式或上下文无关语法，Trex能智能地调整数据以符合指定的架构。用户可以通过Python客户端和API密钥，在云端或本地系统中进行自托管。Trex具备结构化JSON生成、自定义CFG生成和正则生成等功能，且处理速度显著提升，并有明确的开发计划，以满足更多智能模型需求。

swarms

Swarms是一个企业级生产就绪的多代理协作框架，旨在简化多代理的协调过程，提供可靠的自动化解决方案。它支持多种LLM和框架，具有高度定制化能力，并提供长时记忆数据库功能。Swarms适用于在现实世界中执行各种自动化任务，包括长文档理解、分析和检索，通过丰富的工具完成各种数字化任务。

Qwen-Agent

Qwen-Agent是基于通义千问大语言模型的应用开发框架。该框架提供指令跟随、工具使用、规划和记忆等功能，包含浏览器助手和代码解释器等示例应用。它支持自定义工具开发，提供原子级和高级组件，能处理超长文档问答，并在多个基准测试中表现出色。开发者可以利用Qwen-Agent创建智能助手，实现复杂的人工智能应用。

TravelPlanner

TravelPlanner是一个评估语言代理在真实世界规划能力的基准测试。该项目模拟旅行规划场景，要求语言代理根据查询制定包含交通、餐饮、景点和住宿的完整计划。通过设置环境、常识和硬性约束，TravelPlanner全面测试语言模型的规划能力。项目提供两阶段和单一规划两种模式，支持多种语言模型，并配备详细的评估方法和工具。

internlm2_5-7b-chat

InternLM2.5-7B-Chat是一个开源的70亿参数大语言模型，在数学推理、百万字长文理解和工具调用等方面表现卓越。该模型在多项基准测试中超越同等规模模型，展现强大的综合能力。InternLM2.5-7B-Chat提供基础模型和对话模型，支持通过Transformers加载，并可使用LMDeploy、vLLM等方案部署，为开发者提供灵活的应用选择。

Gemma-2-9B-Chinese-Chat

Gemma-2-9B-Chinese-Chat是基于Google Gemma-2-9b-it的指令调优语言模型，适用于中文和英文用户。通过ORPO优化算法和10万对偏好数据进行微调，提升了角色扮演、工具使用等能力，减少中文提问英文回答的问题，改善中英文混杂现象。该模型支持多种场景应用，如模拟对话、数学运算、文字创作等，并提供GGUF文件和ollama模型的下载与使用，以及于Hugging Face存储库的下载和在线演示。

c4ai-command-r-v01

C4AI Command-R是一款35亿参数的生成模型，适用于推理、摘要和问答等多种场景，具备强大的多语言生成能力，支持包括中文在内的10种语言。该模型在Hugging Face等平台提供实验机会，其开放权重设计方便多重用途的使用。采用优化的Transformer架构，并通过有监督微调以符合人类优选方式。通过特定的提示模板，模型能有效执行引用生成，提高回答的准确度和效用。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com