#场景理解
Multi-Task-Transformer - 场景理解多任务变压器模型 TaskPrompter和InvPT
多任务学习场景理解Transformer计算机视觉深度学习Github开源项目
Multi-Task-Transformer项目提供两种场景理解多任务变压器模型:TaskPrompter和InvPT。TaskPrompter利用空间-通道多任务提示进行密集场景理解,InvPT采用倒金字塔架构。这些模型在单目深度估计和3D目标检测等任务中表现出色,并在ICLR2023和ECCV2022会议上发表。项目开源代码和预训练模型,支持多种计算机视觉应用。
upernet-swin-small - UperNet结合Swin Transformer实现精确语义分割
视觉转换Github场景理解开源项目Swin TransformerUperNetHuggingface语义分割模型
UperNet结合Swin Transformer骨干网络,提供高效的语义分割解决方案,适用于多种视觉任务,实现每像素精确语义标签预测。