热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GiT
GiT: 通过通用语言界面实现通用视觉Transformer
2 个月前
GiT是一种创新的视觉AI模型,通过单一的vanilla ViT架构和统一的语言界面,实现了多种视觉任务的整合,展现出优异的多任务协同学习能力和零样本/少样本泛化性能。
GiT
视觉Transformer
多任务学习
计算机视觉
语言接口
Github
开源项目
2 个月前
相关项目
GiT
GiT是一种通用视觉Transformer模型,采用单一ViT架构处理多种视觉任务。该模型设计简洁,无需额外视觉编码器和适配器。通过统一语言接口,GiT实现了从目标检测到图像描述等多任务能力。在多任务训练中,GiT展现出任务间协同效应,性能超越单任务训练且无负迁移。GiT在零样本和少样本测试中表现优异,并随模型规模和数据量增加而持续提升性能。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号