项目简介
OpenHermes-2-Mistral-7B是一个基于Mistral-7B模型微调的最先进大语言模型。该项目以希腊神话中的信使之神赫耳墨斯(Hermes)命名,旨在打造一个能够优雅处理人类对话的AI系统。
技术特点
- 基于90万条主要由GPT-4生成的高质量数据进行训练
- 采用ChatML格式作为对话模板,支持多轮对话
- 支持系统提示词(System Prompt)功能,可以更好地控制模型行为
- 提供了GPTQ、GGUF和AWQ等多种量化版本,方便部署使用
性能表现
在多个基准测试中,OpenHermes-2表现出色:
- 在GPT4All测试中平均得分72.68分
- 在AGI-Eval测试中平均得分39.77分
- 在BigBench推理测试中表现优异
- 相比前代Nous-Hermes和OpenHermes模型都有显著提升
应用场景
该模型展现了多样化的能力:
- 编程对话指导
- 美食菜谱生成
- 角色扮演互动
- 深度思维交流
使用方法
模型使用ChatML格式进行对话,具体格式如下:
<|im_start|>system
[系统提示词]
<|im_end|>
<|im_start|>user
[用户输入]
<|im_end|>
<|im_start|>assistant
[助手回复]
<|im_end|>
部署选项
- 可以使用LM Studio图形界面工具进行本地部署
- 支持多种量化版本:
- GPTQ版本
- GGUF版本
- AWQ版本
开源协议
该项目采用Apache-2.0许可证开源,支持商业使用。
技术支持
- 项目由Teknium开发并维护
- 获得WingLian、One和a16z等机构的算力支持
- TheBloke提供模型量化支持