医学(影像)数据集列表
我主要将此列表作为个人的有趣医学数据集记录,重点关注医学影像。 与其尝试对数据集进行分组/聚类,我将尝试为每个数据集维护一组关键词。 查看提交日志以了解随时间推移的添加内容。
欢迎随时贡献!
免责声明:请记住要解决真正的临床问题 ☺
我们处理的数据集
Neurite-OASIS
来自OASIS数据集的414个T1 MRI,使用FreeSurfer和SAMSEG处理 包括原始图像,以及处理后的体积和生成的解剖分割图 关键词:大型、MRI、分割、标签、注释、已处理
SynthStrip
来自622个MRI、CT和PET扫描的完整头部图像和真实脑部掩模 包括不同对比度、分辨率和人群(从婴儿到胶质母细胞瘤患者)的MRI扫描概览 还包括部分图像的解剖分割图 关键词:大型、多样化、多模态、脑部掩模、分割、脑提取、颅骨剥离
主要医学影像列表
CheXpert
65,240名患者的224,316张胸部X光片,带有报告标签 关键词:超大型、X光、标签
ChestXray-NIHCC
100000张放射线照片 关键词:超大型、X光、标签
MIMIC-CXR
与227,943项影像研究相关的371,920张胸部X光片 2019年3月16日:尚未与MIMIC ICU数据链接。参见新闻文章 v2:自由文本放射学报告 需要申请访问权限 关键词:超大型、X光、标签
PadChest
来自67,000名患者的160,000张图像,由放射科医生解读和报告 标记有174种不同的放射学发现、19种鉴别诊断和104个解剖位置,组织为分层分类,映射到标准统一医学语言系统(UMLS) 关键词:超大型、X光、标签
IBM Xray Eye Gaze
MICMIC-CXR数据库上1000多个眼动、放射学报告、口述、分割数据集 代码可重现实验 关键词:中型、X光、标签
Cancer Image Archive
多个集合 大量各种类型的图像,包括CT、MR、病理学、PT,附带诊断 关键词:超大型、CT、MR、标签
National Lung Screening Trial
Cancer Imaging Archive的一部分 50000多名患者的CT数据,部分病理学,有限可用 关键词:超大型、CT、标签
DeepLesion
32000多个CT扫描,带有注释、元数据、来自放射学报告的语义标签 关键词:超大型、CT、标签
EchoNet-Dynamic
10,000多个带标签的超声心动图视频和人类专家追踪 关键词:超大型、超声、标签
ABCD Neurocognitive Prediction Challenge
8500名年轻(9-10岁)受试者的MRI(约4100用于训练) 关键词:大型、MRI
AAPM Sparse-View CT Reconstruction Challenge
4,000对模拟的2D乳腺CT正弦图/图像对 关键词:大型、CT、重建
Cross-Sectional Multidomain Lexical Processing
两个关于阅读和语言发展的大规模神经影像数据集 超过3000个MRI、fMRI 文章 | 更多资源 关键词:大型、MRI
MRNet
1,370次膝关节MRI检查,带有诊断(健康/ACL撕裂/半月板撕裂) 关键词:大型、MRI、标签
fastMRI
k空间数据 1500个完全采样的膝关节MRI和10K临床MRI,以及6.5K脑部MRI。 作为挑战赛的一部分 关键词:大型、MRI、k空间
OCMR
开放获取的多通道k空间心血管磁共振成像数据集 k空间数据,约250个体积 关键词:中型、MRI、k空间
PREVENT-AD
1704个MRI,556个淀粉样蛋白和tau脑脊液样本,血液标志物,遗传信息和约400名高风险个体的纵向认知数据 关键词:中型、MRI、遗传学、标签
Medical Segmentation Decathlon
10个带有分割的医学图像数据集 来自不同来源的2000多张各种器官的CT和MR图像 关键词:中等规模、MRI、分割
MASSIVE
结构成像验证和评估的多重采集标准化 8000个扩散加权体积 单个健康受试者的10个3D FLAIR、T1加权和T2加权数据集 关键词:大规模、MRI
AOMIC:阿姆斯特丹开放MRI集合
1000多个fMRI和其他模态受试者,带有注释事件文件;原始和预处理数据 关键词:中等规模、fMRI
MRIdata
MRI k空间数据集列表
癌症影像档案:LDCT
601系列CT投影数据、重建图像和临床数据报告 关键词:中等规模、CT、重建
脑部MRI LGG FLAIR异常分割
脑部MRI图像及手动FLAIR异常分割掩模 来自TCIA LGG集合的110个低级别胶质瘤病例 关键词:中等规模、脑部、MRI、分割、LGG、FLAIR
Studyforrest
受试者数量少,但模态多样(T1、T2、SWI、血管造影、DWI,在3T观看《阿甘正传》时的fMRI(音频+视觉+眼动追踪+生理)和7T(仅音频+生理),一些音频任务和其他重要视觉任务) 关键词:小规模、多模态
肺部图像数据联盟
LIDC-IDRI包含诊断和肺癌筛查CT。 1018个病例,部分有放射科医生注释/分割和结节计数 也可通过肺结节分析(LUNA)挑战赛获取 关键词:大规模、CT、标签
乳腺癌MRI数据集
922名乳腺癌患者的公开数据,可用于机器学习和临床研究。 包含乳腺MRI、临床、人口统计、病理、治疗、结果和基因组数据以及图像注释(位置)和特征。 关键词:大规模、MRI、标签
UK Biobank
OpenOrganelle
使用Janelia开发的增强型聚焦离子束扫描电子显微镜(FIB-SEM)技术获取的高分辨率组织尺度体积电子显微镜(vEM)数据集。伴随这些EM体积的是细胞内亚结构的自动分割和分析。 关键词:超大规模、电子显微镜、分割
BrixIA:COVID19严重程度评分评估数据库
4703张COVID19患者的胸部X光片,手动注释Brixia评分 关键词:大规模、X光、新冠
COVID-CT
从几篇COVID19相关论文中收集的349张CT图像 图像说明 关键词:中等规模、CT、新冠
肺炎X光
约5000张X光片 关键词:中等规模、X光、肺炎
医学影像数据资源中心(MIDRC)
361名COVID阳性患者的998次胸部X光检查。 带有外观分类和气腔疾病分级的注释 临床变量 关键词:大规模、X光、新冠
BIMCV-COVID19
1350多张X光片,150多张CT,800个诊断 关键词:中等规模、CT、新冠
MosMedData Covid19
1000多张COVID19患者的CT 50张按像素注释 关键词:大规模、CT、新冠、分割
COVID-19肺部CT病变分割挑战赛
约250张SARS-CoV-2 RT-PCR阳性的胸部CT,带有COVID-19病变注释 关键词:中等规模、CT、新冠、注释、分割
MedSeg COVID-19 CT
约100张分割的CT切片 关键词:中等规模、CT、分割、新冠
COVID-胸部X光
约150张X光片,持续更新,部分医院数据 关键词:中等规模、X光、新冠
BSTI COVID19
持续更新,上次检查时约60名患者,CT 论文PDF 关键词:中等规模、CT、新冠
叙事性功能磁共振成像
345名受试者、891次功能扫描,以及27个不同时长的多样化故事,总计约4.6小时的独特刺激(约43,000字)。 Nature论文 关键词:中等规模,功能磁共振成像
RICORD
1000张X光片和240张CT扫描,附带标注(论文) 关键词:大规模,CT,新冠肺炎,分割
FIRE(眼底图像配准数据集)
129张视网膜图像。 关键词:小规模,眼底
DRIVE:用于血管提取的数字视网膜图像
40张带分割的视网膜图像 关键词:小规模,视网膜,分割
FLARE:快速低GPU内存腹部器官分割
来自11+个国家的500多次CT扫描,包含腹部器官分割(肝脏、肾脏、脾脏和胰腺) 关键词:大规模,腹部,CT
ADNI
各种成像(纵向MRI)、遗传学、临床数据 数千名患者 关键词:大规模,MRI,遗传学,临床
VISCERAL
约120个图像卷(全身CT和MRI图像) 超过1900个已标注的解剖结构 关键词:中等规模,MRI,CT,全身,手动分割
Mindboggle
似乎有101个手动标记的大脑MRI 关键词:中等规模,MRI,大脑,手动分割
跨部门词汇处理横断面研究
3000次脑部扫描(T1w、bold、事件) 标准化测试、分数、人口统计学 关键词:大规模,MRI,功能磁共振成像,测试
杜克乳腺癌筛查DBT
来自5,060名患者的数字乳腺断层合成图像精选数据集。 关键词:大规模,断层合成,DBT,乳腺,检测
CBIS-DDSM(DDSM的精选乳腺影像子集)
2600多项扫描胶片乳腺摄影研究 关键词:大规模,X射线
Neuromorphometrics
63次手动标记的脑部扫描。 费用($1500?) 讨论 关键词:中等规模,MRI,大脑,手动分割,收费
自动非刚性组织学图像配准
这是ISBI2019的一项挑战
7特斯拉静息态功能磁共振成像
22名参与者,包括认知和生理测量,以及7T静息态功能磁共振成像
SpineWeb
跨多个数据集的200多名受试者(CT、X射线、MRI)
先天性心脏病3D心血管MRI中的全心脏和大血管分割
20例先天性心脏病心脏MR图像
儿童纵向神经影像学
论文 约50名儿童(约10岁),单次随访,包括MRI、功能磁共振成像和评估 关键词:中等规模,功能磁共振成像,纵向
儿童算术处理纵向神经影像学
论文 3T功能磁共振成像,132名典型发育儿童,2个时间点,4项任务 关键词:中等规模,功能磁共振成像,纵向
叙事
汇集了大约七年时间内获得的听觉故事聆听功能磁共振成像数据集 关键词:中等规模,功能磁共振成像
ATLAS:卒中后病变的解剖追踪
229次T1加权MRI扫描(n=220),带有病变分割 MNI152标准空间T1加权平均结构模板图像 包含病变元数据的.csv文件 论文 关键词:中等规模,MRI,分割
MITOS_WSI_CMC
21张犬乳腺癌全扫描图像。 由2/3名专家标注 关键词:小规模,2D,全扫描成像
FeTA数据集
48次手动标注的子宫内胎儿MR 关键词:小规模,MRI,胎儿,标签
SIMON
单个志愿者,在多个地点进行了73次扫描,时间跨度约17年 MRI,每次至少进行T1扫描,其他模态因会话而异。 提供表型文件 关键词:小规模,MRI,纵向研究
BigBrain
单个体积,组织学空间,100微米分辨率,包含灰质/白质表面和皮层层 ftp://bigbrain.loris.ca | 交互式 关键词:小规模,组织学,高分辨率,分割
100微米人脑MRI
单个体积,超高分辨率MRI数据集(100微米) 关键词:小规模,MRI,大脑
自然场景数据集(CMRR计划)
8名受试者大规模fMRI(40次会话,高采样率,高分辨率)。T1加权,T2加权,T2*加权MRI 视频描述 关键词:小规模,MRI,大脑,fMRI
大脑目录
不同动物的(离体)大脑MRI或大脑 关键词:小规模,MRI,大脑,动物
多壳层扩散
健康旅行成年人的三次扩散 关键词:小规模,MRI,扩散,大脑
产前MRI
产前大脑MRI样本(似乎是单个受试者?) 关键词:小规模,MRI,胎儿
BCNB:早期乳腺癌粗针活检全扫描图像数据集
1058张全扫描图像(WSIs)及相应的临床特征 部分肿瘤区域在WSIs中已标注 临床特征包括年龄、肿瘤大小、肿瘤类型、ER、PR、HER2、HER2表达、组织学分级、手术、Ki67、分子亚型、淋巴结转移数量和ALN状态 论文参考 关键词:大规模,乳腺癌,多模态,WSI,临床特征
BCI:乳腺癌免疫组织化学图像生成数据集
4870对配准的HE-IHC图像对,涵盖HER2的四个表达水平(0、1+、2+、3+) 关键词:大规模,乳腺癌,HE,IHC
非影像
PhysioNet / 基于MIMIC-CXR的肺水肿严重程度分级
该数据集基于MIMIC-CXR整理,包含3个元数据文件,其中包含通过不同方式从MIMIC-CXR数据集中提取的肺水肿严重程度分级:1)通过正则表达式(regex)从放射学报告中提取,2)由专家从放射学报告中标注,3)通过胸部X光片的共识标注 关键词:肺水肿,严重程度分级,胸部X光,放射学报告,MIMIC-CXR
PhysioNet / 2019年计算心脏病学挑战赛
预测ICU人群中的脓毒症 来自三个不同医院系统的5000名ICU患者
eICU-CRD
详细记录了美国200多家医院超过200,000次重症监护入院的信息 获得MIMIC访问权限后,可在签署更新的数据使用协议后立即访问eICU-CRD 论文
非医学但有用/有趣
其他列表或汇集资源(相关xkcd)
- Giorgos Sfikas:GitHub上的医学影像数据集
- Andy Beam:GitHub上的医学数据
- Christopher Madan:openMorph(开放获取MRI,结构良好的列表)
- Stephen Aylward的开放获取医学图像存储库列表
- Google数据集搜索
- grand-challenges
- 学术种子
- multiBrain
- openneuro数据库 注意其"快速预览"功能
- 癌症影像档案
- 康奈尔公共图像数据库