孙思邈中文医疗大模型项目介绍
项目背景
孙思邈是唐代著名的医药学家,被后人誉为"药王"。他以重视民间医疗经验和持续积累记录闻名,并著有《千金要方》。孙思邈中文医疗大模型(简称Sunsimiao)受其启发,旨在通过不断积累中文医疗数据,提供安全、可靠和普惠的医疗服务。
项目进展
孙思邈项目一直在不断进步:
- 2024年9月12日,Sunsimiao-7B模型上传至WiseModel,并开放下载。
- 2024年9月9日,Sunsimiao-7B模型对外开放在线体验。
- 2024年7月23日,开源7B级别的Sunsimiao-7B模型,擅长处理医学问答和医学考试。
- 2023年7月6日,首次提交孙思邈中文医疗大模型。
模型介绍
孙思邈中文医疗大模型希望继承孙思邈的理念,通过高质量的数据为模型提供精确的医疗问答能力。当前最先进的Sunsimiao-7B模型是在Qwen2-7B基础上,通过优秀的数据微调而成,并在CMB-Exam中达到30B级别模型的SOTA(最优结果)。在中国国家医师、药师、护士资格考试中,模型也表现出色。
模型版本
孙思邈模型提供多个版本以适应不同需求:
- Sunsimiao-7B:最新的7B版本。
- Sunsimiao-01M、Sunsimiao-01M-Chat、Sunsimiao-01M-6B:提供不同规格的模型以供选择。
数据详情
Sunsimiao模型的训练数据来自一个详细构筑的医疗数据池,包含多科室诊断数据、海量问诊对话、医学知识问答和病历分析。这些数据基于开源内容及GPT4自动构建,经人工清洗与标注,有效保障数据的质量和可靠性。目前,数据池仍在持续更新中。
模型评估
在CMB-Exam的评估中,Sunsimiao-7B模型表现优异。同时,在其他国家考试中的准确率也很高,例如:
- 国家执业医师资格考试: 79.23%
- 国家执业药师资格考试: 71.33%
- 国家执业护士资格考试: 83.83%
使用方法
模型使用简单,可通过Python库直接调用。以下是一个简单示例:
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
pipe = pipeline(task=Tasks.text_generation, model='AI-ModelScope/Sunsimiao', model_revision='v1.0.0')
query = '小孩发烧了怎么办?'
prompt = "Below is an instruction that describes a task. Write a response that appropriately completes the request."
prompt += "### Instruction:\n{}\n\n### Response:\n".format(query)
result = pipe(prompt)
print(result)
致谢
孙思邈中文医疗大模型项目由华东理工大学的信息科学与工程学院发起,并得到了多个平台和项目的大力支持,包括LLaMA Efficient Tuning、OpenI启智社区、ModelScope等。同时,对参与指导和支持的组织和社区表示感谢。
免责申明
孙思邈中文医疗大模型可能会产生错误或不适当的输出。在关键或高风险场景中,用户不应将模型用于最终决策,以避免可能的人身或财产损失。使用该模型即表示用户理解并同意这些风险和条款。