Project Icon

Infinity-Instruct-7M-Gen-Llama3_1-8B

开源指令调优模型,支持大规模无监督学习

Infinity-Instruct-7M-Gen-Llama3.1-8B是一个开源指令调优模型,无需人类反馈即可达到较高性能。依托于百万级数据集的训练,该模型展现出优于GPT-4在AlpacaEval 2.0测试中的表现。项目持续更新,提供多样模型权重和数据集资源,支持学术研究。采用FlagScale技术,显著降低训练成本。

Infinity-Instruct-7M-Gen-Llama3_1-8B项目介绍

北京智源人工智能研究院(BAAI)推出了Infinity-Instruct-7M-Gen-Llama3_1-8B项目,这是一个开源的监督指令优化模型,不依赖于人类反馈的强化学习(RLHF)。该模型基于Infinity-Instruct-7M和Infinity-Instruct-Gen数据集进行微调,与GPT4相比,在AlpacaEval 2.0中展现了优异的表现。

新闻动态

训练细节

Infinity-Instruct-7M-Gen-Llama3.1-8B基于百万级别指令数据集Infinity-Instruct进行优化。首先使用Infinity-Instruct-7M提升Llama3-8B的基础能力(数学和代码),形成基础指令模型Infinity-Instruct-7M-Llama3.1-8B。之后,再进一步微调得到更强的聊天模型Infinity-Instruct-7M-Gen-Llama3.1-8B。训练过程中采用了FlagScale工具进行多样化加速技术,减少了训练成本。

训练参数如下:

epoch: 3
lr: 5e-6
min_lr: 0
lr_warmup_steps: 40
lr_decay_style: cosine
weight_decay: 0.0
adam_beta1: 0.9
adam_beta2: 0.95
global_batch_size: 528
clip_grad: 1.0

基准测试

模型MT-BenchAlpacaEval2.0Arena-hard
GPT-4-03149.035.350.0
GPT-4-06139.230.237.9
GPT-4-11069.330.2--
Llama-3-8B-Instruct9.034.446.6
Llama-3.1-8B-Instruct--20.920.6
InfInstruct-7M-Llama-3.1-8B8.233.930.4

Infinity-Instruct-7M-Llama-3.1-8B模型在不使用RLHF的情况下表现突出。

使用方法

Infinity-Instruct-7M-Gen-Llama3.1-8B采用与Llama3-8B-instruct相同的聊天模板。

以下是如何在对话场景中应用该模型和模板的代码示例:

from transformers import AutoModelForCausalLM, AutoTokenizer, LogitsProcessorList
import torch
device = "cuda"

model = AutoModelForCausalLM.from_pretrained("BAAI/Infinity-Instruct-7M-Gen-Llama3_1-8B",
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("BAAI/Infinity-Instruct-7M-Gen-Llama3_1-8B")

prompt = "Give me a short introduction to large language model."
messages = [
    {"role": "user", "content": prompt}
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

logits_processor = LogitsProcessorList(
            [
                MinLengthLogitsProcessor(1, eos_token_id=tokenizer.eos_token_id),
                TemperatureLogitsWarper(0.7),
            ]
 )
 
generated_ids = model.generate(
    model_inputs.input_ids,
    logits_processor=logits_processor,
    max_new_tokens=512
)

generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

免责声明

本项目的代码、数据和模型权重等资源仅限于学术研究用途,禁止用于商业用途。由Infinity Instruct生成的内容因受随机性等不可控因素影响,其准确性无法得到保证。本项目不对模型输出内容,以及使用相关资源及其产生结果所造成的任何损失承担法律责任。

引用

本项目详细介绍Infinity Instruct数据集及其优化模型的论文将在arXiv上发布,敬请期待!

@article{InfinityInstruct2024,
  title={Infinity Instruct},
  author={Beijing Academy of Artificial Intelligence (BAAI)},
  journal={arXiv preprint arXiv:2406.XXXX},
  year={2024}
}
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号