#GiT

GiT: 通过通用语言界面实现通用视觉Transformer

3 个月前

GiT 视觉Transformer 多任务学习计算机视觉语言接口 Github 开源项目

3 个月前

相关项目

GiT

GiT是一种通用视觉Transformer模型,采用单一ViT架构处理多种视觉任务。该模型设计简洁,无需额外视觉编码器和适配器。通过统一语言接口,GiT实现了从目标检测到图像描述等多任务能力。在多任务训练中,GiT展现出任务间协同效应,性能超越单任务训练且无负迁移。GiT在零样本和少样本测试中表现优异,并随模型规模和数据量增加而持续提升性能。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com