项目概述
Nous-Hermes-2-Mistral-7B-DPO-GGUF是一个基于Mistral 7B模型改进的大语言模型项目。它是从OpenHermes-2.5-Mistral-7B模型通过DPO(Direct Preference Optimization)技术优化而来,是当前Hermes系列7B模型中的旗舰版本。
主要特点
- 基于100万条高质量指令/对话数据训练,这些数据达到或超过GPT-4的水平
- 采用ChatML作为对话格式,支持多轮对话和系统提示词
- 在多个基准测试中表现优异,包括AGIEval、BigBench Reasoning、GPT4All和TruthfulQA等
- 支持OpenAI API兼容的接口格式
- 提供多种量化版本的GGUF模型文件
性能表现
该模型在各项基准测试中都取得了显著提升:
- GPT4All测试平均分达到73.72分
- AGIEval测试平均分为43.63分
- BigBench测试平均分为41.94分
- TruthfulQA测试中MC1得分0.3892,MC2得分0.5642
使用方法
模型使用ChatML格式进行对话,支持系统提示词来引导模型的行为和风格。用户可以通过以下方式使用:
- 使用HuggingFace Transformers库进行推理
- 通过LM Studio等支持GGUF格式的GUI工具直接对话
- 支持4bit量化版本,仅需约5GB显存即可运行
实际应用
模型展现出多方面的能力:
- 精确描述天气模式
- 处理复杂的JSON嵌套列表
- 角色扮演(如道家大师)
- 回答各类专业领域问题
技术支持
- 项目由FluidStack提供计算资源支持
- 提供完整的示例代码和API调用文档
- 开源协议为Apache-2.0
- 支持英语等多种语言处理
部署要求
运行模型需要的基本环境:
- Python环境
- PyTorch框架
- Transformers库
- 其他依赖包如bitsandbytes、sentencepiece等
- 支持CUDA的GPU设备(4bit量化版本需要至少5GB显存)