#ViT

Phikon:一个用于组织病理学的自监督学习模型

2 个月前

自监督学习组织病理学掩码图像建模 ViT Phikon Github 开源项目

2 个月前

TransformerHub: 探索深度学习前沿的变形金刚模型仓库

3 个月前

TransformerHub Transformer GPT BERT ViT Github 开源项目

3 个月前

相关项目

TransformerHub

此项目实现了多种Transformer架构，包括seq2seq、仅编码器、仅解码器和统一模型，旨在提高编程技能并提供深度学习参考。特色包括多种Attention模块、位置嵌入和采样方法，当前进展是实现DINO模型。项目受到多个开源项目的启发和支持。

HistoSSLscaling

HistoSSLscaling项目开发了基于掩码图像建模的自监督学习方法，用于病理组织图像分析。该项目的Phikon模型在4000万张全癌种病理切片上预训练，在多项下游任务中表现出色。项目提供了预训练模型、代码和数据集特征，为计算病理学研究提供支持。

vit_base_patch32_224.augreg_in21k_ft_in1k

ViT图像分类模型在ImageNet-21k上训练并在ImageNet-1k上微调，采用数据增强和正则化，适用于图像识别和特征提取。模型包含88.2M参数，通过PyTorch实现，支持多种应用场景。

vit_small_r26_s32_384.augreg_in21k_ft_in1k

该模型结合ResNet与Vision Transformer（ViT）的特点，专用于图像分类。最初在ImageNet-21k上训练，后在ImageNet-1k上微调，并在JAX中创建，由Ross Wightman移植到PyTorch环境中。模型采用了36.5M参数和27.7M激活，针对384x384图像进行了优化，通过增强和正则化技术提升了处理复杂图像任务的能力，适用于多种图像识别应用。

vit_large_patch14_dinov2.lvd142m

这是一个基于Vision Transformer架构的图像特征提取模型，采用DINOv2自监督学习方法在LVD-142M数据集上预训练。模型包含3.044亿参数，支持518x518像素输入，适用于图像分类和特征提取任务。该模型提供了完整的加载、预处理和推理示例代码，可应用于需要高质量视觉特征表示的各种计算机视觉场景。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com