明医 (MING):中文医疗问诊大模型
项目简介
明医 (MING) 是一个开源的中文医疗问诊模型,致力于利用大模型技术提升医疗问诊的效率和准确性。模型被微调以执行医疗指令,能够实现以下主要功能:
- 医疗问答:能够回答医疗问题并进行案例分析,为医疗从业者和患者提供参考信息。
- 智能问诊:支持多轮问诊后生成诊断结果及建议,帮助医生进行更精确的临床判断。
相关论文
明医项目的研究基础扎实,依托多篇学术论文为理论支持,包括:
-
MING-MOE技术报告:介绍了如何通过低秩适配器专家的稀疏混合,提升大型语言模型的医疗多任务学习能力。论文链接
更新
模型逐步升级与优化,不同时期的更新包括:
- 2024年4月14日:基于Qwen1.5开源的专家混合模型MING-MOE。
- 2024年3月14日:基于Qwen1.5-1.8b的MING-1.8B。
- 2023年7月25日:基于bloomz-7b的MING-7B,以及MedicalGPT-zh更名为MING。
开源模型
多种版本的MING模型以适应不同的基础平台和需求,支持在HuggingFace平台上下载使用:
- MING-7B:基于bloomz-7b1-mt。
- MING-1.8B 和 MING-MOE-1.8B:以Qwen1.5-1.8B为基座。
- MING-MOE-4B、7B、14B:各自分别基于Qwen1.5的不同版本。
快速开始
以下是快速体验明医模型的方法:
- 配置环境:建议的配置环境为Python 3.9.16,PyTorch 2.0.1+cu117,并安装peft 0.9.0。
- 安装依赖:
git clone https://github.com/MediaBrain-SJTU/MING cd MING pip install -e .
- 运行模型:对显存至少为15G的单卡服务器,下载模型参数后即可运行。
例如,运行MING-MOE:
CUDA_VISIBLE_DEVICES=0 python -m ming/serve/cli.py \
--model_path {path_to_checkpoint} \
--model_base {path_to_base_model} \
--max_new_token 3072
测试样例
在不同情境下的测试案例图片,为用户展示模型的实际应用效果和人机交互体验。
贡献与开发团队
此项目由上海交通大学未来媒体网络协同创新中心与上海人工智能实验室智慧医疗中心联合研发,主要成员包括廖育生、江书洋、刘泓呈和孟昱同,指导教师为王钰副教授。
免责声明
本项目提供的预训练模型仅供研究和参考,不能用于实际决策。用户应自行承担使用的风险,项目方不对因使用模型产生的任何后果或损失负责。
引用
如果使用本项目的数据或代码,请在您的研究中进行引用。以下是一些推荐的引用格式:
@article{liao2024ming,
title={MING-MOE: Enhancing Medical Multi-Task Learning in Large Language Models with Sparse Mixture of Low-Rank Adapter Experts},
author={Liao, Yusheng and Jiang, Shuyang and Wang, Yu and Wang, Yanfeng},
journal={arXiv preprint arXiv:2404.09027},
year={2024}
}
@misc{MING,
author={Yusheng Liao, Yutong Meng, Hongcheng 刘, Yu Wang, Yanfeng Wang},
title = {明医 (MING):中文医疗问诊大模型},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/MediaBrain-SJTU/MING}},
}
明医项目以其强大的技术支持与不断的技术更新,致力于在中文医疗问诊领域提供有力的工具和技术支持。