NexusRaven-V2-13B项目简介
项目背景
NexusRaven-V2-13B是一个极具商业前景的开源项目,专注于函数调用能力。该模型在函数调用的表现上已经超越了目前最先进的技术水平,尤其是在零样本函数调用任务中超过了GPT-4。
主要功能
- 强大的函数调用能力:NexusRaven-V2可以生成简单调用、嵌套调用以及并行调用,适应多种复杂场景。
- 详细的可解释性:它能够详细解释所生成的函数调用过程,这种特性可以选择开启或关闭,以节省推理时的资源。
- 出色的表现:在一些人类生成的嵌套和复合函数使用案例中,NexusRaven-V2的调用成功率比GPT-4高出7%。
- 广泛的适应性:即使NexusRaven-V2从未在评估中使用过的函数上进行过训练,它仍然展现出良好的适应能力。
- 商业使用的灵活性:NexusRaven-V2的训练过程中未涉及任何由专有大型语言模型(如GPT-4)生成的数据,因此在商业应用中用户有完全的控制权。
模型使用指南
NexusRaven-V2可以接受包含Python函数列表的输入,并通过这些函数执行各种任务,包括向外部API发送GET/POST请求。模型在处理带有参数的函数时表现最佳,因此建议输入的函数应包含参数。
功能特色
NexusRaven-V2可以生成深度嵌套的函数调用、并行调用以及简单调用,并能对生成的调用进行合理化解释。用户可以通过设置停止标记来控制模型只生成调用而不生成解释。
快速上手指南
为了充分发挥NexusRaven-V2的性能,建议在使用过程中提供格式良好、详细的docstring,并确保所有传递给模型的函数都包含参数。默认设置建议关闭采样并使用非常低的温度值(约0.001)。
示例代码可以帮助用户快速在GPU上运行模型,并以此了解如何使用模型生成函数调用及其合理化解释。
模型评估
NexusRaven-V2的测试结果详见Github上的项目说明。如果需要更深入的了解,可以参考相关的博客或文档。
使用注意事项
- 模型在处理大量函数时表现最佳,需要与检索器结合以避免上下文窗口过载。
- 存在生成不正确调用的可能性,建议设置适当的防护措施以捕捉错误行为。
- 生成的解释可能不准确,建议同样设置防护措施。
许可和参考
NexusRaven-V2在一个可商业化的数据集上训练,使用的许可协议参见Nexusflow社区许可证。
对此项目贡献的所有团队成员和支持者,特别感谢CodeLlama团队的帮助和支持。
加入我们的Discord频道以获取更多帮助或反馈问题。