xLAM-8x7b-r项目介绍
项目背景
xLAM是一个大型语言模型系列,旨在通过自动化任务计划与执行,提高决策能力并将用户意图转化为可执行的操作。这些模型在多领域工作流程中具有极高的自动化潜力,是人工智能代理系统的重要组成部分。在本项目中,xLAM-8x7b-r是其中一个重要成员以支持多种应用场景的文本生成与调用功能。
模型系列
xLAM提供了一系列不同大小和功能的模型,以满足多种应用需求,包括具备函数调用功能和通用代理应用的优化版本。模型的参数数量、上下文长度以及下载链接如下:
模型名称 | 总参数数量 | 上下文长度 | 模型下载链接 |
---|---|---|---|
xLAM-1b-fc-r | 1.35B | 16k | 下载链接 |
xLAM-7b-fc-r | 6.91B | 4k | 下载链接 |
xLAM-7b-r | 7.24B | 32k | 下载链接 |
xLAM-8x7b-r | 46.7B | 32k | 下载链接 |
xLAM-8x22b-r | 141B | 64k | 下载链接 |
库存概览
此项目库专注于通用工具使用模型系列,而专门为函数调用设计的模型系列可以在xLAM的fc
系列这里查看。该系列提供了一整套针对HuggingFace的设置、使用和整合指南。
使用指南
对于想要使用xLAM模型的用户,需首先安装transformers
库,可通过如下命令安装:
pip install transformers>=4.41.0
我们的模型最佳实践来自于我们提供的提示格式,它可以生成类似ChatGPT功能调用模式的JSON输出。请参考以下示例,了解如何在单轮和多轮使用情况下应用我们的模型。
示例用法
在单轮使用情况下,用户可以通过输入查询问题,例如“纽约的天气预报如何?”然后通过调用预定义的API工具来获取所需信息。在多轮使用场景中,模型支持复杂的人机交互,如先获取天气预报信息,然后进行进一步的查询或操作。
生成输出
通过这一过程,用户最终可以得到类似如下的JSON输出:
{"thought": "需要获取纽约的当前天气信息,温度为华氏度。", "tool_calls": [{"name": "get_weather", "arguments": {"location": "New York", "unit": "fahrenheit"}}]}
基准测试结果
在多个功能调用和工具查询的基准测试中,xLAM表现出色。在Berkeley Function-Calling Leaderboard中,该模型在总准确率分类项中获得了最高的分数,其中“FC”模式代表使用该模型提取功能调用的功能。
许可证
本模型采用CC-BY-NC-4.0许可证进行分发,仅限研究用途。
引用
如果您发现这个项目对您的研究或工作有帮助,请考虑引用我们的文献:
@article{zhang2024xlam,
title={xLAM: A Family of Large Action Models to Empower AI Agent Systems},
author={Zhang, Jianguo and Lan, Tian and Zhu, Ming and others},
journal={arXiv preprint arXiv:2409.03215},
year={2024}
}