#工具使用
langchain-benchmarks - LLM任务基准测试工具
Github开源项目基准测试工具使用LangChain BenchmarksLangSmithLLM任务
提供多种LLM任务基准测试工具,涵盖数据集收集、任务评估等全流程。依赖LangSmith平台,附有详细文档和实例,鼓励用户优化和测试解决方案。
trex - 结构化数据转换工具,支持正则表达式与上下文无关语法
Github开源项目安装指南Trex数据转换工具使用功能路线图
Trex是一款将非结构化数据转换为结构化数据的工具。通过指定正则表达式或上下文无关语法,Trex能智能地调整数据以符合指定的架构。用户可以通过Python客户端和API密钥,在云端或本地系统中进行自托管。Trex具备结构化JSON生成、自定义CFG生成和正则生成等功能,且处理速度显著提升,并有明确的开发计划,以满足更多智能模型需求。
swarms - 企业级多代理协作自动化框架
Github开源项目自主代理工具使用Swarms多代理协同长期记忆数据库
Swarms是一个企业级生产就绪的多代理协作框架,旨在简化多代理的协调过程,提供可靠的自动化解决方案。它支持多种LLM和框架,具有高度定制化能力,并提供长时记忆数据库功能。Swarms适用于在现实世界中执行各种自动化任务,包括长文档理解、分析和检索,通过丰富的工具完成各种数字化任务。
Qwen-Agent - 基于千问大模型的应用开发框架 支持工具调用和长文本处理
Github开源项目LLM应用工具使用Qwen-Agent代理框架自定义助手
Qwen-Agent是基于通义千问大语言模型的应用开发框架。该框架提供指令跟随、工具使用、规划和记忆等功能,包含浏览器助手和代码解释器等示例应用。它支持自定义工具开发,提供原子级和高级组件,能处理超长文档问答,并在多个基准测试中表现出色。开发者可以利用Qwen-Agent创建智能助手,实现复杂的人工智能应用。
TravelPlanner - 真实世界规划的语言代理基准测试
Github开源项目基准测试语言代理规划工具使用TravelPlanner
TravelPlanner是一个评估语言代理在真实世界规划能力的基准测试。该项目模拟旅行规划场景,要求语言代理根据查询制定包含交通、餐饮、景点和住宿的完整计划。通过设置环境、常识和硬性约束,TravelPlanner全面测试语言模型的规划能力。项目提供两阶段和单一规划两种模式,支持多种语言模型,并配备详细的评估方法和工具。
internlm2_5-7b-chat - 卓越推理能力与百万字超长上下文的开源大模型
Github开源项目大语言模型模型HuggingfaceInternLM推理能力工具使用上下文窗口
InternLM2.5-7B-Chat是一个开源的70亿参数大语言模型,在数学推理、百万字长文理解和工具调用等方面表现卓越。该模型在多项基准测试中超越同等规模模型,展现强大的综合能力。InternLM2.5-7B-Chat提供基础模型和对话模型,支持通过Transformers加载,并可使用LMDeploy、vLLM等方案部署,为开发者提供灵活的应用选择。
Gemma-2-9B-Chinese-Chat - 首个专为中英文用户优化的指令调优模型
Github开源项目语言模型模型Huggingface工具使用roleplayingGemma-2-9B-Chinese-Chat中文学习
Gemma-2-9B-Chinese-Chat是基于Google Gemma-2-9b-it的指令调优语言模型,适用于中文和英文用户。通过ORPO优化算法和10万对偏好数据进行微调,提升了角色扮演、工具使用等能力,减少中文提问英文回答的问题,改善中英文混杂现象。该模型支持多种场景应用,如模拟对话、数学运算、文字创作等,并提供GGUF文件和ollama模型的下载与使用,以及于Hugging Face存储库的下载和在线演示。
c4ai-command-r-v01 - 多语言生成和推理的高效大型语言模型
Github开源项目模型生成模型Huggingface文档引用工具使用C4AI Command-R多语言生成
C4AI Command-R是一款35亿参数的生成模型,适用于推理、摘要和问答等多种场景,具备强大的多语言生成能力,支持包括中文在内的10种语言。该模型在Hugging Face等平台提供实验机会,其开放权重设计方便多重用途的使用。采用优化的Transformer架构,并通过有监督微调以符合人类优选方式。通过特定的提示模板,模型能有效执行引用生成,提高回答的准确度和效用。
相关文章