热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GiT
GiT - 通用视觉Transformer模型实现多任务统一
Github
开源项目
计算机视觉
多任务学习
视觉Transformer
GiT
语言接口
GiT是一种通用视觉Transformer模型,采用单一ViT架构处理多种视觉任务。该模型设计简洁,无需额外视觉编码器和适配器。通过统一语言接口,GiT实现了从目标检测到图像描述等多任务能力。在多任务训练中,GiT展现出任务间协同效应,性能超越单任务训练且无负迁移。GiT在零样本和少样本测试中表现优异,并随模型规模和数据量增加而持续提升性能。
1
1
相关文章
GiT: 通过通用语言界面实现通用视觉Transformer
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号