CellViT:基于视觉Transformer的精确细胞分割与分类方法

Ray

CellViT:基于视觉Transformer的精确细胞分割与分类方法

CellViT是由德国埃森大学医院人工智能医学研究所(IKIM)开发的一种新型深度学习方法,用于对数字化组织样本中的细胞核进行自动化实例分割。这项研究成果发表在Medical Image Analysis期刊上,论文题为《CellViT: Vision Transformers for precise cell segmentation and classification》。

研究背景与意义

在血细胞和嗜酸性组织(H&E)染色的组织图像中进行细胞核检测和分割是一项重要的临床任务,对于许多应用来说都至关重要。然而,由于细胞核在染色和大小上的变异性,以及细胞核边界重叠和聚集等因素,这项任务仍然具有挑战性。虽然卷积神经网络已被广泛应用于该任务,但研究人员开始探索基于Transformer的网络在这一领域的潜力。

CellViT方法简介

CellViT是一种基于视觉Transformer的深度学习架构,用于对数字化组织样本中的细胞核进行自动化实例分割。该方法在PanNuke数据集上进行了训练和评估,这是一个具有挑战性的细胞核实例分割数据集,包含了19种组织类型中近20万个带注释的细胞核,分为5个临床重要类别。

CellViT网络架构

CellViT的主要特点包括:

  1. 视觉Transformer编码器:项目采用了预训练的视觉Transformer(ViT)编码器,这种编码器在各种计算机视觉任务中都表现出色。这一选择提高了CellViT的分割性能。

  2. U-Net架构:CellViT采用了U-Net形状的编码器-解码器网络结构,可以高效准确地进行细胞核实例分割。该网络架构有助于提取高层和低层特征,从而改善分割结果。

  3. 加权采样策略:为了提高CellViT的性能,研究人员引入了一种新的加权采样策略。这一策略改善了对具有挑战性的细胞核实例的表示,从而得到更准确的分割结果。

  4. 千兆像素WSI快速推理:该框架通过使用1024×1024像素的大型推理patch尺寸(相比传统的256像素patch),实现了快速推理。这种方法能够高效分析千兆像素级别的全扫描图像(WSI),并生成可本地化的深度特征,为下游任务提供潜在价值。

实验结果与性能

CellViT在PanNuke数据集上实现了最先进的细胞核检测和实例分割性能:

  • 平均全景质量(PQ):0.51
  • F1检测分数:0.83

研究人员通过利用最近发布的Segment Anything Model(SAM)和在1.04亿个组织学图像patch上预训练的ViT编码器,展示了大规模领域内和领域外预训练的视觉Transformer的优越性。

PanNuke数据集上的结果示例

开源与应用

CellViT项目的代码已在GitHub上开源(https://github.com/TIO-IKIM/CellViT),研究人员可以自由使用和改进这一方法。项目提供了详细的安装指南、使用说明和预处理流程,方便其他研究人员复现结果和在自己的数据集上应用CellViT。

此外,研究团队还提供了预训练模型的下载链接,包括:

  • CellViT-SAM-H
  • CellViT-256
  • CellViT-SAM-H-x20
  • CellViT-256-x20

这些模型使用了90%的所有折叠数据进行训练,采用了论文中描述的设置。

未来展望

CellViT项目团队目前正在优化推理速度,相关代码将在未来几周内更新。此外,他们计划在未来的版本中提供一个Docker镜像,其中包含所有必要的依赖项和预安装的配置。这个Docker镜像将确保可重复性并简化设置过程,允许轻松安装和使用该项目。

总的来说,CellViT为细胞核实例分割任务提供了一种强大而灵活的解决方案。通过结合视觉Transformer的优势和创新的网络架构设计,CellViT在challenging的PanNuke数据集上取得了优异的性能。这项研究不仅推动了医学图像分析领域的发展,也为其他领域的实例分割任务提供了新的思路和方法。随着项目的持续改进和社区的参与,CellViT有望在未来发挥更大的作用,为医学研究和临床实践做出重要贡献。

avatar
0
0
0
最新项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号