相关项目
MedCAT
MedCAT是一款用于从电子健康记录(EHR)中提取信息并将其链接到生物医学术语库(如SNOMED-CT和UMLS)的工具。它支持多个模型,包括UMLS小型模型、完整的SNOMED国际模型和荷兰UMLS模型等。用户可以通过UMLS用户认证下载最新的模型包。项目持续更新,新增功能包括医疗文本否定检测和患者时间线深度生成建模。此外,还发布了多篇相关研究论文。安装简单,可选择支持GPU或CPU。
MedQuAD
MedQuAD是一个包含47,457对医学问答的大规模数据集,源自12个美国国立卫生研究院(NIH)网站。它涵盖37种问题类型,涉及疾病、药物和其他医疗实体,并附有丰富的语义注释。此外,MedQuAD提供2,479个经人工评判的答案作为QA测试集,可用于评估信息检索和问答系统的性能。这一资源为医学自然语言处理和问答系统研究提供了重要支持。
roberta-es-clinical-trials-ner
这是一个针对西班牙语临床试验文本的医学命名实体识别模型。它可以识别四类语义实体:解剖结构、化学物质、疾病和医疗程序。模型基于bsc-bio-ehr-es预训练模型微调而来,在评估集上展现出较高的准确率和F1值。目前该模型仍在开发中,主要用于分析临床试验相关文本,不适合直接应用于医疗决策。