项目介绍:QiZhenGPT与MedCopilot
QiZhenGPT:中文医学大语言模型
QiZhenGPT是一个开源的中文医学大语言模型,它的创建旨在为中文医疗场景提供更准确的帮助。这个项目基于启真医学知识库构建了中文医学指令数据集,利用该数据集在不同的模型架构上,如Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B,进行了指令微调训练,使模型在医疗领域的表现得到了显著提升。
该项目的最初阶段发布了针对药品知识问答的评测数据集,未来计划进一步优化疾病、手术、检验等问题的回答能力,并扩展到医患问答、病历自动生成等应用领域。
MedCopilot:智能医疗助手
MedCopilot是一款智慧医疗助手,基于启真医学大模型、启真医学知识库以及医疗临床数据研发。它的核心目标是为患者、医生和医院管理层提供全面的智能支持。这款助手旨在利用AI技术和丰富的医学知识来提高医疗服务的质量和效率。
目前,MedCopilot已在浙江大学第二附属医院正式上线使用,成为医疗行业的新动力。
MedCopilot的功能亮点
-
功能清单助手:自动汇总医生每日的重要工作事项,包括住院患者统计、手术情况、会诊情况、文书书写和重点患者分析。
-
辅助诊疗助手:通过整合患者的临床数据和医学知识库,为医生提供更精准的诊断和治疗建议。
-
医疗质量助手:依据国家相关政策实时监控医疗过程数据,提前发现和纠正潜在问题。
-
病历文书助手:能自动生成符合规范的病历文书,减轻医生的重复性工作,提高效率。
QiZhenGPT的技术细节
数据集构建
当前许多开源的ChatLLM项目依赖于其他模型生成的指令数据,难免出现数据不准确的问题。为提高医疗领域知识问答的准确性,QiZhenGPT使用了大量真实的医患知识问答数据和经过精心设计的半结构化数据模板生成的指令集。具体数据构成如下:
- 真实医患知识问答数据,总计56万条。
- 药品知识数据,与启真医学知识库结合生成,总计18万条。
- 疾病知识数据,与启真医学知识库结合生成,总计29.8万条。
训练细节与模型效果
QiZhenGPT在多种不同基础模型上进行了指令微调,采用强大的硬件资源进行大量训练,显著提升了模型在医学领域的问答效果。
下载与使用
项目还提供了模型的下载链接,用户可以通过简单的环境配置和脚本执行快速启动模型的演示。其中,模型支持在本地通过面向用户的Gradio界面进行交互,这样即使是没有编程基础的人也能方便地使用。
实验评测与成果
在药品适应症与疾病问题的实验测试中,QiZhenGPT均展示出了优于其他主流模型的识别准确性和反应速度,为医疗行业智能化应用提供了可靠的技术支持。
总而言之,QiZhenGPT项目在技术上坚持“数据+知识双轮驱动”的路线,将创新的AI技术与可靠的医学数据相结合,力求为医疗行业的数字化发展提供全新的解决方案和实践基础。