项目介绍:xLAM-8x22b-r
项目背景
xLAM模型系列(大型动作模型)是一种先进的大规模语言模型,专为提升决策能力而设计,能够将用户意图转换为可执行的操作,与现实世界进行互动。这些模型能自动规划并执行任务以实现特定目标,充当AI代理的“大脑”。这种能力使其能够自动化各种领域的工作流程,拥有广泛的应用前景。
xLAM模型系列
Salesforce提供了一系列不同规模的xLAM模型,以满足各种应用需求,包括优化的函数调用和常规智能体应用。其中,xLAM-8x22b-r拥有1410亿参数,支持长达64K的上下文长度,属于现有最大规模的模型之一。
存储库概览
xLAM系列存储库主要关于一些通用工具使用系列,更多专业化的函数调用模型可见其“fc”系列。用户可以通过HuggingFace库来设置、使用和集成这些模型。关于具体的技术框架,项目使用了Transformers 4.41.0,Pytorch 2.3.0+cu121和Datasets 2.19.1等开源工具进行开发。
模型使用方法
用户可以通过HuggingFace平台来使用这些模型,具体步骤如下:
-
安装Transformers库:
pip install transformers>=4.41.0
-
设置输入提示,并生成API请求或AI助手响应。示例代码通过专业的提示格式协助生成JSON格式的函数调用,与ChatGPT的函数调用模式相似。
-
支持多轮交互:xLAM模型支持多轮对话,帮助开发者更新对话历史,提高任务完成的准确性。
基准测试结果
- Berkeley函数调用排行榜(BFCL):在与其他模型的对比中,xLAM系列表现出色,特别是在函数调用成功率方面排名靠前。
- Webshop和ToolQuery:展示了在复杂网络环境和工具查询场景下的优异表现。
- ToolQuery-Unified和ToolBench:在统一工具查询和工具测试台上,xLAM系列显示出高通过率和稳定性。
许可证
xLAM模型系列遵循CC-BY-NC-4.0许可证,仅供研究使用。为了继续支持新版本的发布,用户可以访问相关平台和存储库以获取更多信息。
引用
如果项目有助于您的研究工作,请引用以下相关论文:
@article{zhang2024xlam,
title={xLAM: A Family of Large Action Models to Empower AI Agent Systems},
author={Zhang, Jianguo and Lan, Tian et al.},
year={2024}
}
xLAM项目代表了一种创新的人工智能发展方向,通过大规模语言模型的应用,使得AI代理系统能够更加有效和智能地完成复杂任务。