#视觉transformer

vitmatte-base-composition-1k - Vision Transformer驱动的图像抠图模型
计算机视觉Huggingface模型深度学习ViTMatte图像抠图视觉transformerGithub开源项目
ViTMatte-base-composition-1k是一个基于Vision Transformer的图像抠图模型,在Composition-1k数据集上训练。该模型采用ViT结构和轻量级头部,能准确估计图像前景对象。ViTMatte在图像抠图任务中表现优异,为图像前景提取提供了高效解决方案。
vitmatte-small-composition-1k - Vision Transformer驱动的先进图像抠图模型
模型图像抠图计算机视觉Github深度学习视觉transformerViTMatte开源项目Huggingface
ViTMatte-small-composition-1k模型采用Vision Transformer技术,为图像抠图任务带来突破性进展。其简洁有效的结构设计,结合Composition-1k数据集的训练,实现了高精度的前景对象分割。该开源项目不仅为研究人员提供了直接可用的工具,还通过Hugging Face平台支持进一步的模型优化,推动了计算机视觉技术的发展。
H-optimus-0 - 自监督视觉Transformer在病理学与组织学中的应用
开源项目模型GithubH-optimus-0Huggingface病理学视觉transformer医疗影像自监督学习
H-optimus-0是一个开源的视觉Transformer模型,基于11亿参数,利用自监督学习在50万张H&E染色全幅切片病理图像上训练。该模型能从组织学图像中提取强大特征,支持突变预测、生存分析和组织分类等应用。模型期望输入图像尺寸为224x224,建议在CUDA设备上采用混合精度以加快推断。适用于医学图像处理,尤其在病理学与组织学研究中表现出色。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号