EEVE-Korean-Instruct-10.8B-v1.0

EEVE-Korean-Instruct-10.8B-v1.0项目介绍

EEVE-Korean-Instruct-10.8B-v1.0是一个基于yanolja/EEVE-Korean-10.8B-v1.0模型进行微调的韩语大语言模型。这个项目旨在提供一个高性能的韩语指令跟随模型，能够理解和执行用户的各种指令。

模型背景

该模型是在yanolja/EEVE-Korean-10.8B-v1.0的基础上进行了进一步的优化。而yanolja/EEVE-Korean-10.8B-v1.0本身是upstage/SOLAR-10.7B-v1.0模型的韩语词汇扩展版本。项目团队使用了直接偏好优化（Direct Preference Optimization，简称DPO）技术，通过Axolotl工具进行了模型的微调。

技术特点

词汇扩展：针对韩语进行了专门的词汇扩展，提高了模型对韩语的理解和生成能力。
指令跟随：通过DPO技术的应用，增强了模型执行特定指令的能力。
大规模参数：模型包含10.8B参数，具有强大的语言理解和生成能力。

训练数据

模型的训练数据主要包括：

Korean-translated版本的Open-Orca/SlimOrca-Dedup数据集
Korean-translated版本的argilla/ultrafeedback-binarized-preferences-cleaned数据集

值得注意的是，项目团队没有使用其他额外的数据集，保证了训练数据的纯净性和专注性。

使用方法

EEVE-Korean-Instruct-10.8B-v1.0模型可以通过Hugging Face的transformers库轻松调用。用户需要使用特定的提示模板来获得最佳效果：

prompt_template = "A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions.\nHuman: {prompt}\nAssistant:\n"