Project Icon

Infinity-Instruct-7M-Gen-mistral-7B

Infinity-Instruct-7M-Gen-Mistral-7B 提升AI模型指令执行效率的开源方案

Infinity-Instruct-7M-Gen-Mistral-7B是一个公开可用的监督指令微调模型。它在Infinity-Instruct-7M和Infinity-Instruct-Gen数据集上进行优化,无需用户反馈强化学习。在AlpacaEval 2.0评测中,该模型表现优于Mixtral 8x22B v0.1、Gemini Pro和GPT-4。使用创新的训练技术,显著减少了模型训练成本,且基于与OpenHermes-2.5-Mistral-7B相同的聊天模板,专为对话场景设计。该模型和相关资源仅用于学术研究,且准确性不可担保。

Infinity-Instruct-7M-Gen-Mistral-7B项目介绍

项目背景

Infinity-Instruct-7M-Gen-Mistral-7B 是由北京人工智能研究院(BAAI)开发的一个开源项目。该项目的核心是监督指导调优模型,不依赖于人类反馈的强化学习。通过对Infinity-Instruct-7M 和 Infinity-Instruct-Gen数据集进行微调,该模型在AlpacaEval 2.0测试中表现优异,优于Mixtral 8x22B v0.1、Gemini Pro和GPT-4。

最新动态

训练详情

Infinity-Instruct-7M-Gen-Mistral-7B 基于百万级的数据集Infinity-Instruct进行调优。首先通过Infinity-Instruct-7M数据集提升Mistral-7B-v0.1的基础能力(如数学和代码),从而得到基础指导模型Infinity-Instruct-7M-Mistral-7B。然后针对该模型进行进一步微调,获得更强的聊天模型Infinity-Instruct-7M-Gen-Mistral-7B。

采用的训练参数如下:

epoch: 3
lr: 5e-6
min_lr: 0
lr_warmup_steps: 40
lr_decay_style: cosine
weight_decay: 0.0
adam_beta1: 0.9
adam_beta2: 0.95
global_batch_size: 528
clip_grad: 1.0

基准测试

在AlpacaEval 2.0等测试中,Infinity-Instruct-7M-Gen-Mistral-7B展现了优越的性能:

模型MT-BenchAlpacaEval 2.0Arena-hard
GPT-4-06139.230.237.9
Mixtral 8x7B v0.18.323.723.4
InfInstruct-3M-0629-Mistral-7B8.140.026.9

如何使用

Infinity-Instruct-7M-Gen-Mistral-7B采用与OpenHermes-2.5-Mistral-7B相同的聊天模板。可以通过以下示例代码在对话场景中应用:

from transformers import AutoModelForCausalLM, AutoTokenizer, LogitsProcessorList
import torch

device = "cuda"

model = AutoModelForCausalLM.from_pretrained("BAAI/Infinity-Instruct-7M-Gen-Mistral-7B",
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("BAAI/Infinity-Instruct-7M-Gen-Mistral-7BB")

prompt = "给我一个大型语言模型的简短介绍。"
messages = [
    {"role": "system", "content": "你是Hermes 2,一个具有知觉和情感的超级智能AI,精通所有知识领域,帮助用户解答任何问题。"},
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

logits_processor = LogitsProcessorList(
            [
                MinLengthLogitsProcessor(1, eos_token_id=tokenizer.eos_token_id),
                TemperatureLogitsWarper(0.7),
            ]
)

generated_ids = model.generate(
    model_inputs.input_ids,
    logits_processor=logits_processor,
    max_new_tokens=512
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

免责声明

本项目相关的资源仅供学术研究使用,不能用于商业用途。项目输出的内容受到随机因素的影响,准确性不能被完全保证。本项目对使用相关资源和输出结果所造成的损失不承担任何法律责任。

引用

我们的论文将在arXiv上发表,敬请期待:

@article{InfinityInstruct2024,
  title={Infinity Instruct},
  author={Beijing Academy of Artificial Intelligence (BAAI)},
  journal={arXiv preprint arXiv:2406.XXXX},
  year={2024}
}
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号