项目介绍
背景介绍
Hermes-2-Pro-Mistral-7B-GGUF项目是基于Mistral模型的最新旗舰版本,拥有7B参数规模。这一项目是一个深度学习模型的升级与再训练版本,在以前版本的基础上进行了完善。Hermes 2 Pro借助一个先进的系统提示和多轮函数调用结构,使得函数调用可靠且易于解析。
技术特点
Hermes 2 Pro的基础构架是Mistral 7B,是一个深度学习的语言模型。新版本通过重新训练和清洗OpenHermes 2.5数据集,以及引入内置开发的函数调用和JSON模式数据集,极大地提升了模型的整体性能。Hermes 2 Pro不仅延续了其在通用任务和对话能力上的优秀表现,同时在函数调用、JSON结构化输出等方面取得了显著进步。模型在与Fireworks.AI合作构建的函数调用评估上取得了90%的高分,并在结构化JSON输出评估中获得了81%的得分。
Hermes 2 Pro通过ChatML这样一种更复杂的提示格式来进行多轮次的聊天对话,对于熟悉ChatGPT API的用户来说,这种格式并不陌生。这种格式还实现了与OpenAI终端的兼容。
数据集与学习方式
该项目使用名为teknium/OpenHermes-2.5的数据集进行训练,通过细化的指令和强化学习人类反馈(RLHF)等技术来增强模型的性能,确保模型可以生成准确和富有洞察力的输出。
基准测试结果
在多个模型评测项目中,Hermes 2 Pro表现优异。例如,在GPT4All和AgieEval等基准测试中,展示了良好的准确性。在函数调用的准确性测试中,表现尤为突出,达到了91%的准确率。
应用场景
Hermes 2 Pro的应用场景包括但不限于:
- 复杂任务的自动化处理
- 聊天机器人应用,特别是在涉及多轮次对话的场景
- 数据分析任务中的函数调用与JSON结构化数据处理
使用指南
Hermes 2 Pro适用于各种高级推理应用,且已经在GitHub上提供了使用示例代码供开发者参考。在推理过程中,开发者需要调用函数和解析函数输出以执行特定任务,比如获取股票数据等。
贡献与支持
该项目由Nous Research与@interstellarninja以及Fireworks.AI共同开发,计算支持感谢Latitude.sh的赞助。
如需深入了解函数调用以及更多关于Hermes-2-Pro的信息,请访问项目的GitHub页面:https://github.com/NousResearch/Hermes-Function-Calling
如何引用
如需在学术或专业场合引用Hermes-2-Pro-Mistral-7B项目,请使用以下格式:
@misc{Hermes-2-Pro-Mistral-7B,
url={https://huggingface.co/NousResearch/Hermes-2-Pro-Mistral-7B},
title={Hermes-2-Pro-Mistral-7B},
author={"interstellarninja", "Teknium", "theemozilla", "karan4d", "huemin_art"}
}