#UMLS

MedQuAD: 突破性的医疗问答数据集及其在自然语言处理中的应用

3 个月前

MedQuAD 医疗问答数据集 NIH网站问答系统 UMLS Github 开源项目

3 个月前

相关项目

MedCAT

MedCAT是一款用于从电子健康记录(EHR)中提取信息并将其链接到生物医学术语库（如SNOMED-CT和UMLS）的工具。它支持多个模型，包括UMLS小型模型、完整的SNOMED国际模型和荷兰UMLS模型等。用户可以通过UMLS用户认证下载最新的模型包。项目持续更新，新增功能包括医疗文本否定检测和患者时间线深度生成建模。此外，还发布了多篇相关研究论文。安装简单，可选择支持GPU或CPU。

MedQuAD

MedQuAD是一个包含47,457对医学问答的大规模数据集，源自12个美国国立卫生研究院（NIH）网站。它涵盖37种问题类型，涉及疾病、药物和其他医疗实体，并附有丰富的语义注释。此外，MedQuAD提供2,479个经人工评判的答案作为QA测试集，可用于评估信息检索和问答系统的性能。这一资源为医学自然语言处理和问答系统研究提供了重要支持。

roberta-es-clinical-trials-ner

这是一个针对西班牙语临床试验文本的医学命名实体识别模型。它可以识别四类语义实体:解剖结构、化学物质、疾病和医疗程序。模型基于bsc-bio-ehr-es预训练模型微调而来,在评估集上展现出较高的准确率和F1值。目前该模型仍在开发中,主要用于分析临床试验相关文本,不适合直接应用于医疗决策。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com