#UMLS

MedCAT - 从电子健康记录中提取信息并链接到生物医学术语库

MedCAT电子健康记录生物医学本体论UMLSSNOMED-CTGithub开源项目

MedCAT是一款用于从电子健康记录(EHR)中提取信息并将其链接到生物医学术语库（如SNOMED-CT和UMLS）的工具。它支持多个模型，包括UMLS小型模型、完整的SNOMED国际模型和荷兰UMLS模型等。用户可以通过UMLS用户认证下载最新的模型包。项目持续更新，新增功能包括医疗文本否定检测和患者时间线深度生成建模。此外，还发布了多篇相关研究论文。安装简单，可选择支持GPU或CPU。

MedQuAD - 涵盖多类医学问题的大规模问答数据集

MedQuAD医疗问答数据集NIH网站问答系统UMLSGithub开源项目

MedQuAD是一个包含47,457对医学问答的大规模数据集，源自12个美国国立卫生研究院（NIH）网站。它涵盖37种问题类型，涉及疾病、药物和其他医疗实体，并附有丰富的语义注释。此外，MedQuAD提供2,479个经人工评判的答案作为QA测试集，可用于评估信息检索和问答系统的性能。这一资源为医学自然语言处理和问答系统研究提供了重要支持。

roberta-es-clinical-trials-ner - 西班牙语临床试验文本的医学命名实体识别模型

模型西班牙语UMLSroberta-es-clinical-trials-ner临床试验开源项目Huggingface医学命名实体识别Github

这是一个针对西班牙语临床试验文本的医学命名实体识别模型。它可以识别四类语义实体:解剖结构、化学物质、疾病和医疗程序。模型基于bsc-bio-ehr-es预训练模型微调而来,在评估集上展现出较高的准确率和F1值。目前该模型仍在开发中,主要用于分析临床试验相关文本,不适合直接应用于医疗决策。

相关文章

Article Cover

MedQuAD: 突破性的医疗问答数据集及其在自然语言处理中的应用

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号