#工具使用

langchain-benchmarks - LLM任务基准测试工具

Github开源项目基准测试工具使用LangChain BenchmarksLangSmithLLM任务

提供多种LLM任务基准测试工具，涵盖数据集收集、任务评估等全流程。依赖LangSmith平台，附有详细文档和实例，鼓励用户优化和测试解决方案。

trex - 结构化数据转换工具，支持正则表达式与上下文无关语法

Github开源项目安装指南Trex数据转换工具使用功能路线图

Trex是一款将非结构化数据转换为结构化数据的工具。通过指定正则表达式或上下文无关语法，Trex能智能地调整数据以符合指定的架构。用户可以通过Python客户端和API密钥，在云端或本地系统中进行自托管。Trex具备结构化JSON生成、自定义CFG生成和正则生成等功能，且处理速度显著提升，并有明确的开发计划，以满足更多智能模型需求。

swarms - 企业级多代理协作自动化框架

Github开源项目自主代理工具使用Swarms多代理协同长期记忆数据库

Swarms是一个企业级生产就绪的多代理协作框架，旨在简化多代理的协调过程，提供可靠的自动化解决方案。它支持多种LLM和框架，具有高度定制化能力，并提供长时记忆数据库功能。Swarms适用于在现实世界中执行各种自动化任务，包括长文档理解、分析和检索，通过丰富的工具完成各种数字化任务。

Qwen-Agent - 基于千问大模型的应用开发框架支持工具调用和长文本处理

Github开源项目LLM应用工具使用Qwen-Agent代理框架自定义助手

Qwen-Agent是基于通义千问大语言模型的应用开发框架。该框架提供指令跟随、工具使用、规划和记忆等功能，包含浏览器助手和代码解释器等示例应用。它支持自定义工具开发，提供原子级和高级组件，能处理超长文档问答，并在多个基准测试中表现出色。开发者可以利用Qwen-Agent创建智能助手，实现复杂的人工智能应用。

TravelPlanner - 真实世界规划的语言代理基准测试

Github开源项目基准测试语言代理规划工具使用TravelPlanner

TravelPlanner是一个评估语言代理在真实世界规划能力的基准测试。该项目模拟旅行规划场景，要求语言代理根据查询制定包含交通、餐饮、景点和住宿的完整计划。通过设置环境、常识和硬性约束，TravelPlanner全面测试语言模型的规划能力。项目提供两阶段和单一规划两种模式，支持多种语言模型，并配备详细的评估方法和工具。

internlm2_5-7b-chat - 卓越推理能力与百万字超长上下文的开源大模型

Github开源项目大语言模型模型HuggingfaceInternLM推理能力工具使用上下文窗口

InternLM2.5-7B-Chat是一个开源的70亿参数大语言模型，在数学推理、百万字长文理解和工具调用等方面表现卓越。该模型在多项基准测试中超越同等规模模型，展现强大的综合能力。InternLM2.5-7B-Chat提供基础模型和对话模型，支持通过Transformers加载，并可使用LMDeploy、vLLM等方案部署，为开发者提供灵活的应用选择。

Gemma-2-9B-Chinese-Chat - 首个专为中英文用户优化的指令调优模型

Github开源项目语言模型模型Huggingface工具使用roleplayingGemma-2-9B-Chinese-Chat中文学习

Gemma-2-9B-Chinese-Chat是基于Google Gemma-2-9b-it的指令调优语言模型，适用于中文和英文用户。通过ORPO优化算法和10万对偏好数据进行微调，提升了角色扮演、工具使用等能力，减少中文提问英文回答的问题，改善中英文混杂现象。该模型支持多种场景应用，如模拟对话、数学运算、文字创作等，并提供GGUF文件和ollama模型的下载与使用，以及于Hugging Face存储库的下载和在线演示。

c4ai-command-r-v01 - 多语言生成和推理的高效大型语言模型

Github开源项目模型生成模型Huggingface文档引用工具使用C4AI Command-R多语言生成

C4AI Command-R是一款35亿参数的生成模型，适用于推理、摘要和问答等多种场景，具备强大的多语言生成能力，支持包括中文在内的10种语言。该模型在Hugging Face等平台提供实验机会，其开放权重设计方便多重用途的使用。采用优化的Transformer架构，并通过有监督微调以符合人类优选方式。通过特定的提示模板，模型能有效执行引用生成，提高回答的准确度和效用。

相关文章

Article Cover

LangChain Benchmarks: 为LLM相关任务提供基准测试的开源工具包

Article Cover

Swarms - 未来智能体协作的革命性框架

Article Cover

Qwen-Agent: 打造智能助手的强大框架

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号