ICCV 2023低级视觉任务最新进展综述

低层视觉图像恢复超分辨率去噪去模糊 Github 开源项目

ICCV 2023低级视觉任务最新进展综述

国际计算机视觉大会(ICCV)作为计算机视觉领域的顶级会议,每两年举办一次,汇聚了来自全球的顶尖学者和工业界专家。ICCV 2023于10月2日至6日在法国巴黎举行,会议涵盖了计算机视觉的各个方面,其中低级视觉任务是一个重要的研究方向。本文将对ICCV 2023中低级视觉任务的最新进展进行全面总结,为读者提供该领域的最新研究动态。

图像复原

图像复原是低级视觉中的一个重要任务,旨在从退化的图像中恢复原始高质量图像。在ICCV 2023中,该方向涌现了多项创新工作:

SYENet提出了一种简单而有效的网络结构,可以同时处理多个低级视觉任务,并在移动设备上实现实时性能。该工作为轻量级多任务模型的设计提供了新的思路。
DiffIR将扩散模型引入图像复原任务,通过迭代去噪过程实现高质量的图像恢复。该方法展示了扩散模型在低级视觉任务中的潜力。
PIRNet提出了一种基于小波变换的隐私保护图像复原网络,在保护图像隐私的同时实现高质量复原。
Focal Network引入了一种新的注意力机制,可以更好地捕捉图像的局部和全局信息,从而提升复原效果。
多项工作针对特定场景如水下图像、浊气图像、壁画等进行了专门的复原算法设计,体现了图像复原向特定应用场景深化的趋势。

图像复原示例

超分辨率

超分辨率是将低分辨率图像转换为高分辨率图像的技术,在ICCV 2023中该方向也有多项突破性工作:

SRFormer提出了一种基于重排自注意力的Transformer结构,在单图像超分辨率任务上取得了优异性能。
DLGSANet设计了一种轻量级的动态局部和全局自注意力网络,在保证效果的同时大幅降低了计算量。
DAT提出了一种双聚合Transformer结构,可以更好地融合多尺度特征信息。
多项工作针对盲超分辨率、参考图引导超分辨率等具体场景进行了算法改进,进一步提升了超分辨率技术的实用性。
在医学图像、光场图像等特定领域的超分辨率也有多项创新工作,体现了超分辨率技术向更广泛应用场景扩展的趋势。

超分辨率示例

去噪

图像去噪旨在从含噪图像中恢复干净的图像,是一个经典而重要的低级视觉任务。ICCV 2023中该方向的主要进展包括:

多项工作探索了自监督和无监督去噪方法,如SDAP提出了随机子样本生成策略,CBSN设计了条件盲点网络等,减少了对配对数据的依赖。
Noise2Info提出了一种新的自监督学习范式,通过从噪声图像中提取噪声信息来指导去噪过程。
LED提出了一种无需校准的RAW图像去噪流程,通过两对图像实现高质量去噪。
ExposureDiffusion将扩散模型引入低光照增强任务,通过学习曝光调整实现图像增强和去噪。
针对高光谱图像去噪等特定任务也有多项创新工作,拓展了去噪技术的应用场景。

去模糊

图像去模糊旨在从模糊图像中恢复清晰图像,在ICCV 2023中该方向的主要进展包括:

多项工作探索了多尺度结构和频域信息在去模糊中的应用,如MSG-Diffusion利用多尺度结构引导扩散模型,MRLPF设计了多尺度残差低通滤波网络等。
一些工作针对特定的模糊类型如散焦模糊、行依赖模糊等进行了算法设计,提高了去模糊的针对性和有效性。
在基于事件相机的去模糊方面也有多项创新工作,如GEM提出了一种可泛化的事件引导去模糊方法。
在视频去模糊方面,有工作探索了时间频谱在深度视频去模糊中的应用,为视频去模糊提供了新的思路。

去雨

图像去雨旨在从含雨图像中去除雨线和雨滴的影响,恢复清晰的图像。ICCV 2023中该方向的主要进展包括:

LHP-Rain提出了一个大规模的真实雨天图像数据集,为真实场景下的去雨研究提供了重要资源。
RLP引入了雨滴位置先验,提升了夜间去雨的效果。
UDR-S2Former设计了一种基于稀疏采样的Transformer结构,可以同时去除雨滴和雨线。
一些工作探索了基于事件相机的无监督视频去雨方法,为去雨任务提供了新的思路。

其他低级视觉任务

除上述主要任务外,ICCV 2023中还涉及了去雾、去马赛克、HDR成像、帧插值等多个低级视觉任务方向,均有不同程度的创新和突破。这些工作共同推动了低级视觉技术的全面进步。

总结与展望

ICCV 2023中低级视觉任务的研究呈现出以下几个主要趋势:

自监督和无监督学习方法得到广泛探索,减少了对标注数据的依赖。
扩散模型等生成模型在低级视觉任务中的应用不断深入。
Transformer结构在各类低级视觉任务中的应用持续深化。
针对特定场景和应用的算法设计不断增多,体现了低级视觉技术向实际应用深化的趋势。
轻量化和高效化仍是一个重要研究方向,以适应移动端等资源受限场景。

未来,低级视觉任务的研究可能会在以下几个方面继续深入:

进一步探索大规模预训练模型在低级视觉任务中的应用。
加强低级视觉任务与高级视觉任务的结合,发展端到端的视觉系统。
深化对真实场景数据的处理能力,提高模型的实用性和鲁棒性。
探索更高效的网络结构和学习方法,以适应更广泛的应用场景。
加强低级视觉任务的可解释性研究,提高模型的可信度。

总的来说,ICCV 2023展示了低级视觉任务研究的蓬勃发展态势,相信在学术界和工业界的共同努力下,低级视觉技术将在不久的将来迎来更大的突破,为计算机视觉的整体发展做出重要贡献。

相关项目

Project Cover

Awesome-ICCV2023-Low-Level-Vision

该项目整理汇总了ICCV2023会议发表的低层视觉领域论文和相关代码实现。内容涵盖图像恢复、超分辨率、去噪、去模糊等多个研究方向,并进行了分类整理。项目提供论文链接和代码仓库地址,方便研究者快速查找所需资源。同时还收录了其他相关会议的低层视觉论文集合链接,为该领域研究提供全面的参考资料。

Project Cover

Awesome-CVPR2024-Low-Level-Vision

这个项目汇总了CVPR2024会议中与低层视觉任务相关的论文和代码，内容涵盖图像复原、超分辨率、去噪和去模糊等多个研究方向。项目提供了这些领域最新研究成果的概览，包括创新方法及其开源实现。通过持续更新，该资源库为计算机视觉领域的研究人员和开发者提供了及时、全面的学术参考。

Project Cover

Q-Bench是一个评估多模态大语言模型低层视觉能力的基准测试。它通过感知、描述和评估三个领域，使用LLVisionQA和LLDescribe数据集测试模型性能。该项目采用开放式评估框架，支持研究者提交结果或模型。Q-Bench对比了开源和闭源模型的表现，并与人类专家水平进行对照，为深入理解和提升多模态AI的基础视觉处理能力提供了关键洞察。

相关文章

Article Cover

Awesome-CVPR2024-Low-Level-Vision: 一个汇集CVPR2024低层视觉论文和代码的令人惊叹的项目

Article Cover

Q-Bench：多模态大语言模型在低层视觉任务上的基准测试

最新项目

Project Cover

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

商汤小浣熊

小浣熊家族Raccoon，您的AI智能助手，致力于通过先进的人工智能技术，为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答，小浣熊都能以快速、准确的响应满足您的需求，让您的生活更加智能便捷。

Project Cover

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

Project Cover

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号