#UMLS
MedCAT - 从电子健康记录中提取信息并链接到生物医学术语库
MedCAT电子健康记录生物医学本体论UMLSSNOMED-CTGithub开源项目
MedCAT是一款用于从电子健康记录(EHR)中提取信息并将其链接到生物医学术语库(如SNOMED-CT和UMLS)的工具。它支持多个模型,包括UMLS小型模型、完整的SNOMED国际模型和荷兰UMLS模型等。用户可以通过UMLS用户认证下载最新的模型包。项目持续更新,新增功能包括医疗文本否定检测和患者时间线深度生成建模。此外,还发布了多篇相关研究论文。安装简单,可选择支持GPU或CPU。
MedQuAD - 涵盖多类医学问题的大规模问答数据集
MedQuAD医疗问答数据集NIH网站问答系统UMLSGithub开源项目
MedQuAD是一个包含47,457对医学问答的大规模数据集,源自12个美国国立卫生研究院(NIH)网站。它涵盖37种问题类型,涉及疾病、药物和其他医疗实体,并附有丰富的语义注释。此外,MedQuAD提供2,479个经人工评判的答案作为QA测试集,可用于评估信息检索和问答系统的性能。这一资源为医学自然语言处理和问答系统研究提供了重要支持。
roberta-es-clinical-trials-ner - 西班牙语临床试验文本的医学命名实体识别模型
模型西班牙语UMLSroberta-es-clinical-trials-ner临床试验开源项目Huggingface医学命名实体识别Github
这是一个针对西班牙语临床试验文本的医学命名实体识别模型。它可以识别四类语义实体:解剖结构、化学物质、疾病和医疗程序。模型基于bsc-bio-ehr-es预训练模型微调而来,在评估集上展现出较高的准确率和F1值。目前该模型仍在开发中,主要用于分析临床试验相关文本,不适合直接应用于医疗决策。