Project Icon

CodeFuse-DevOps-Model

中文DevOps大模型助力开发运维全生命周期

CodeFuse-DevOps-Model作为首个开源中文开发运维大模型,专注于DevOps全生命周期问题解决。基于Qwen系列并经高质量中文DevOps语料训练,模型在同规模对比中表现卓越。项目囊括7B和14B基座及对齐模型,并配备在线试用和评测基准。在多个DevOps评测数据集中,模型均取得优异成绩,为开发者提供了可靠的DevOps智能支持。

DevOps模型

🤗 Hugging Face • 🤖 ModelScope

中文 | English

DevOps-Model是业界首个开源的中文开发运维大模型系列,主要致力于在DevOps领域发挥实际价值。目前,DevOps-Model能够帮助工程师回答在DevOps生命周期中遇到的问题。

我们基于Qwen系列模型,经过高质量中文DevOps语料加训后产出Base模型,然后经过DevOps问答数据对齐后产出Chat模型。我们的Base模型和Chat模型在开源和DevOps领域相关的评测数据上可以取得同规模模型中的最佳效果。欢迎来我们部署的在线试用地址体验模型效果:https://modelscope.cn/studios/codefuse-ai/DevOps-Model-Demo/summary

同时我们也在搭建DevOps领域专属的评测基准DevOpsEval,用来更好地评测DevOps领域模型的效果。

最新消息

模型下载

开源模型和下载链接见下表: 🤗 Huggingface地址

基座模型对齐模型对齐模型Int4量化
7BDevOps-Model-7B-BaseDevOps-Model-7B-Chat即将推出
14BDevOps-Model-14B-BaseDevOps-Model-14B-Chat即将推出

🤖 ModelScope地址

基座模型对齐模型对齐模型Int4量化
7BDevOps-Model-7B-BaseDevOps-Model-7B-Chat即将推出
14BDevOps-Model-14B-BaseDevOps-Model-14B-Chat即将推出

模型评测

我们先选取了CMMLU和CEval两个评测数据集中与DevOps相关的一共六项考试。总计一共574道选择题,具体信息如下:

评测数据集考试科目题数
CMMLU计算机科学204
CMMLU计算机安全171
CMMLU机器学习122
CEval大学编程37
CEval计算机体系结构21
CEval计算机网络19

我们分别测试了零样本和五样本的结果,我们的7B和14B系列模型可以在测试的模型中取得最好的成绩,更多的测试结果后续也会发布。

基础模型零样本得分五样本得分
DevOps-Model-14B-Base70.7373.00
Qwen-14B-Base69.1671.25
Baichuan2-13B-Base55.7561.15
DevOps-Model-7B-Base62.7262.02
Qwen-7B-Base55.7556.00
Baichuan2-7B-Base49.3055.4
Internlm-7B-Base47.5652.6

对话模型零样本得分五样本得分
DevOps-Model-14B-Chat74.0475.96
Qwen-14B-Chat69.1670.03
Baichuan2-13B-Chat52.7955.23
DevOps-Model-7B-Chat62.2064.11
Qwen-7B-Chat46.0052.44
Baichuan2-7B-Chat52.5655.75
Internlm-7B-Chat52.6155.75


快速使用

我们提供简单的示例来说明如何利用 🤗 Transformers 快速使用 Devops-Model-Chat 模型。

安装依赖

pip install -r requirements.txt

Chat 模型推理示例

from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation import GenerationConfig

tokenizer = AutoTokenizer.from_pretrained("path_to_DevOps-Model-Chat", trust_remote_code=True)

model = AutoModelForCausalLM.from_pretrained("path_to_DevOps-Model-Chat", device_map="auto", trust_remote_code=True, bf16=True).eval()

# 指定 generation_config
model.generation_config = GenerationConfig.from_pretrained("path_to_DevOps-Model-Chat", trust_remote_code=True)

# 第一轮对话
resp, hist = model.chat(query='你是谁', tokenizer=tokenizer, history=None)
print(resp)
# 我是 DevOps-Model,一个由蚂蚁集团平台技术事业群风险智能团队和北京大学联合研发的人工智能机器人,可以与用户进行自然语言交互,并协助解答 DevOps 全生命周期中的各种问题。如果您有任何需要协助的问题或者想要进行闲聊,都可以和我交流哦。

# 第二轮对话
resp2, hist2 = model.chat(query='Java 中 HashMap 和 Hashtable 有什么区别', tokenizer=tokenizer, history=hist)
print(resp2)
# HashMap 和 Hashtable 都是 Java 中常用的哈希表实现,它们的主要区别在于:
# 1. Hashtable 是线程安全的,而 HashMap 不是线程安全的,因此在多线程环境下,Hashtable 的性能更稳定。
# 2. Hashtable 中的方法都是同步的,而 HashMap 的方法不是同步的,因此在多线程环境下,Hashtable 的性能更好。
# 3. Hashtable 中的 key 和 value 都必须实现 Serializable 接口,而 HashMap 中的 key 和 value 可以是任何对象,包括基本数据类型。
# 4. Hashtable 的初始容量是 11,而 HashMap 的初始容量是 16。
# 总之,如果需要在多线程环境下使用哈希表,并且需要保证线程安全,那么应该使用 Hashtable;如果不需要考虑线程安全,或者需要快速地进行哈希表操作,那么应该使用 HashMap。

# 第三轮对话
resp3, hist3 = model.chat(query='线程安全代表什么', tokenizer=tokenizer, history=hist2)
print(resp3)
# 线程安全是指在多线程环境下,程序能够正确地处理并发访问,并且不会出现数据竞争、死锁、饥饿等异常情况。线程安全的程序可以保证在不同的线程之间共享同一个数据结构时,数据的正确性和一致性。线程安全的实现通常需要使用同步机制,如锁、原子操作等,来保证对共享数据的访问是线程安全的。在 Java 中,可以通过 synchronized 关键字、Lock 接口等机制来实现线程安全。

模型训练

数据准备

代码内部通过调用 datasets.load_dataset 读取数据,支持 load_dataset 所支持的数据读取方式,比如 json,csv,自定义读取脚本等方式(但推荐数据准备为 jsonl 格式的文件)。然后还需要更新 data/dataset_info.json 文件,具体可以参考 data/README.md

预训练

如果收集了一批文档之类的语料(比如公司内部产品的文档)想要在 devopspal 模型上加训,可以执行 scripts/devops-model-pt.sh 来发起一次加训来让模型学习到这批文档的知识,具体代码如下:

set -v
torchrun --nproc_per_node=8 --nnodes=$WORLD_SIZE --master_port=$MASTER_PORT --master_addr=$MASTER_ADDR --node_rank=$RANK src/train_bash.py \
    --deepspeed conf/deepspeed_config.json \    # deepspeed配置文件路径
	--stage pt \    # 表示执行预训练
    --model_name_or_path path_to_model \    # 从huggingface下载的devopspal模型路径
    --do_train \
    --report_to 'tensorboard' \
    --dataset your_corpus \    # 数据集名称,需与dataset_info.json中定义的一致
    --template default \    # 模板,预训练就使用default
    --finetuning_type full \  # 全量微调或lora微调
    --output_dir path_to_output_checkpoint_path \    # 模型checkpoint保存路径
    --overwrite_cache \
    --per_device_train_batch_size 8 \
    --per_device_eval_batch_size 8 \
    --gradient_accumulation_steps 1 \
    --lr_scheduler_type cosine \
    --warmup_ratio 0.05 \
    --evaluation_strategy steps \
    --logging_steps 10 \
    --max_steps 1000 \
    --save_steps 1000 \
    --eval_steps 1000 \
    --learning_rate 5e-6 \
    --plot_loss \
    --max_source_length=2048 \
    --dataloader_num_workers 8 \
    --val_size 0.01 \
    --bf16 \
    --overwrite_output_dir

用户可以在此基础上进行调整以启动自己的训练。建议通过 python src/train_bash.py -h 获取完整的参数列表,以了解更详细的配置选项。

指令微调

如果收集了一批QA数据想要对devopspal进行进一步对齐,可以执行 scripts/devops-model-sft.sh 来启动一次微调,使模型在收集到的数据上进行对齐。具体代码如下:

set -v 

torchrun --nproc_per_node=8 --nnodes=$WORLD_SIZE --master_port=$MASTER_PORT --master_addr=$MASTER_ADDR --node_rank=$RANK src/train_bash.py \
    --deepspeed conf/deepspeed_config.json \    # deepspeed配置文件路径
    --stage sft \    # 表示执行微调
    --model_name_or_path path_to_model \    # 从huggingface下载的模型路径
    --do_train \
    --report_to 'tensorboard' \
    --dataset your_corpus \    # 数据集名称,需与dataset_info.json中定义的一致
    --template chatml \    # qwen模型的模板固定为chatml
    --finetuning_type full \    # 全量微调或lora微调
    --output_dir /mnt/llm/devopspal/model/trained \     # 模型checkpoint保存路径
    --overwrite_cache \
    --per_device_train_batch_size 8 \
    --per_device_eval_batch_size 8 \
    --gradient_accumulation_steps 1 \
    --lr_scheduler_type cosine \
    --warmup_ratio 0.05 \
    --evaluation_strategy steps \
    --logging_steps 10 \
    --max_steps 1000 \
    --save_steps 100 \
    --eval_steps 100 \
    --learning_rate 5e-5 \
    --plot_loss \
    --max_source_length=2048 \
    --dataloader_num_workers 8 \
    --val_size 0.01 \
    --bf16 \
    --overwrite_output_dir

用户可以在此基础上进行调整以启动自己的SFT训练。建议通过 python src/train_bash.py -h 获取完整的参数列表,以了解更详细的配置选项。

量化

我们将提供DevOps-Model-Chat系列的量化模型,当然也可以通过以下代码来量化自己微调过的模型:

from transformers import AutoModelForCausalLM, AutoTokenizer
from optimum.gptq import GPTQQuantizer, load_quantized_model
import torch

# 加载模型
model_name = "path_of_your_model"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)

# 加载数据
# todo

# 开始量化
quantizer = GPTQQuantizer(bits=4, dataset="c4", block_name_to_quantize = "model.decoder.layers", model_seqlen = 2048)
quantized_model = quantizer.quantize_model(model, tokenizer)

# 保存量化后的模型
out_dir = 'save_path_of_your_quantized_model'
quantized_model.save_quantized(out_dir)

联系我们

免责声明

由于语言模型的特性,模型生成的内容可能包含幻觉或歧视性言论。请谨慎使用DevOps-Model系列模型生成的内容。 如果要公开使用或商用该模型服务,请注意服务方需承担由此产生的不良影响或有害言论的责任,本项目开发者不承担任何由使用本项目(包括但不限于数据、模型、代码等)导致的危害或损失。

引用

如果使用本项目的代码或模型,请引用本项目论文:

链接:DevOps-Model

@article{devopspal2023,
  title={},
  author={},
  journal={arXiv preprint arXiv},
  year={2023}
}

Acknowledgements

This project references the following open-source projects. We would like to express our gratitude to the projects and their research and development teams.

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号