2024年CVPR低层视觉方向优秀论文和代码汇总

我正在与Kobaayyy合作收集2024年CVPR低层视觉相关的论文和代码。

请点击这里查看。

低层视觉相关汇总

概览

图像恢复
- 视频恢复
超分辨率
- 图像超分辨率
- 视频超分辨率
图像重缩放
去噪
- 图像去噪
去模糊
- 图像去模糊
- 视频去模糊
去雨
去雾
HDR成像/多曝光图像融合
帧插值
图像增强
- 低光照图像增强
图像协调化
图像修复/填充
图像抠图
图像压缩
图像质量评估
风格迁移
图像编辑
图像生成/合成/图像到图像转换
- 视频生成
其他

图像恢复

图像重建

HIR-Diff: 基于改进扩散模型的无监督高光谱图像恢复

论文: https://arxiv.org/abs/2402.15865
代码: https://github.com/LiPang/HIRDiff

视频恢复

从实践中获取真知：用于视频恶劣天气去除的扩散测试时间自适应

论文:
代码: https://github.com/scott-yjyang/DiffTTA

超分辨率

图像超分辨率

CAMixerSR: 只有细节需要更多"注意力"

论文: https://arxiv.org/abs/2402.19289
代码: https://github.com/icandle/CAMixerSR

SinSR: 单步扩散图像超分辨率

论文：https://github.com/wyf0912/SinSR/blob/main/main.pdf
代码: https://github.com/wyf0912/SinSR

视频超分辨率

FMA-Net: 用于联合视频超分辨率和去模糊的基于光流引导的动态滤波和迭代特征细化多注意力网络

论文: https://arxiv.org/abs/2401.03707
代码: https://github.com/KAIST-VICLab/FMA-Net

通过隐式重采样对齐增强视频超分辨率

论文: https://arxiv.org/abs/2305.00163
代码: https://github.com/kai422/IART

去模糊

视频去模糊

FMA-Net: 用于联合视频超分辨率和去模糊的基于光流引导的动态滤波和迭代特征细化多注意力网络

论文: https://arxiv.org/abs/2401.03707
代码: https://github.com/KAIST-VICLab/FMA-Net

模糊感知时空稀疏Transformer用于视频去模糊

论文:
代码: https://github.com/huicongzhang/BSSTNet

图像编辑

PAIR-Diffusion: 全面的多模态对象级图像编辑器

论文: https://arxiv.org/abs/2303.17546
代码: https://github.com/Picsart-AI-Research/PAIR-Diffusion

使用自然语言的无反演图像编辑

论文:
代码: https://github.com/sled-group/InfEdit

专注于你的指令：通过注意力调制实现细粒度和多指令图像编辑

论文: https://arxiv.org/abs/2312.10113
代码: https://github.com/guoqincode/Focus-on-Your-Instruction

编辑一个适用于所有：交互式批量图像编辑

论文: https://arxiv.org/abs/2401.10219
代码: https://github.com/thaoshibe/edit-one-for-all

MACE: 扩散模型中的批量概念擦除

论文:
代码: https://github.com/Shilin-LU/MACE

视频编辑

VidToMe: 用于零样本视频编辑的视频令牌合并

论文: https://arxiv.org/abs/2312.10656
代码: https://github.com/VISION-SJTU/VidToMe

图像生成/合成 / 图像到图像转换

文本到图像 / 文本引导 / 多模态

PIA: 你的个性化图像动画师，通过文本到图像模型的即插即用模块

论文: https://github.com/open-mmlab/PIA
代码: https://arxiv.org/abs/2312.13964

SVGDreamer: 使用扩散模型的文本引导SVG生成

论文: https://arxiv.org/abs/2312.16476
代码: https://github.com/ximinng/SVGDreamer ECLIPSE：重新审视文本到图像先验以实现高效图像生成
论文：https://arxiv.org/abs/2312.04655
代码：https://github.com/eclipse-t2i/eclipse-inference

智能格林 -- 通过潜在扩散模型进行开放式视觉讲故事

论文：https://arxiv.org/abs/2306.00973
代码：https://github.com/haoningwu3639/StoryGen

DreamMatcher：语义一致的文本到图像个性化的外观匹配自注意力

论文：https://arxiv.org/abs/2402.09812
代码：https://github.com/KU-CVLAB/DreamMatcher

InstanceDiffusion：图像生成的实例级控制

论文：https://arxiv.org/abs/2402.03290
代码：https://github.com/frank-xwang/InstanceDiffusion

InteractDiffusion：文本到图像扩散模型的交互控制

论文：https://arxiv.org/abs/2312.05849
代码：https://github.com/jiuntian/interactdiffusion?tab=readme-ov-file

图像到图像 / 图像引导

姿势引导人物图像合成的粗到细潜在扩散

论文：https://github.com/YanzuoLu/CFLD
代码：https://arxiv.org/abs/2402.18078

其他图像生成

残差去噪扩散模型

论文：https://arxiv.org/abs/2308.13712
代码：https://github.com/nachifur/RDDM

DemoFusion：无需高昂成本实现高分辨率图像生成的民主化

论文：https://arxiv.org/abs/2311.16973
代码：https://github.com/PRIS-CV/DemoFusion

ElasticDiffusion：无需训练的任意尺寸图像生成

论文：https://arxiv.org/abs/2311.18822
代码：https://github.com/MoayedHajiAli/ElasticDiffusion-official

DeepCache：免费加速扩散模型

论文：https://arxiv.org/abs/2312.00858
代码：https://github.com/horseee/DeepCache

视频生成

MagicAnimate：使用扩散模型进行时间一致的人物图像动画

论文：https://arxiv.org/abs/2311.16498
代码：https://github.com/magic-research/magic-animate

VMC：使用时间注意力适应的文本到视频扩散模型进行视频运动定制

论文：https://arxiv.org/abs/2312.00845
代码：https://github.com/HyeonHo99/Video-Motion-Customization

EvalCrafter：大型视频生成模型的基准测试和评估

论文：https://arxiv.org/abs/2310.11440
代码：https://github.com/evalcrafter/EvalCrafter

说话人头生成

SyncTalk：说话人头合成中的魔鬼在于同步

论文：https://arxiv.org/abs/2311.17590
代码：https://github.com/ZiqiaoPeng/SyncTalk

[返回概览]

其他

Q-Instruct：提高多模态基础模型的低级视觉能力

论文：https://arxiv.org/abs/2311.06783
代码：https://github.com/Q-Future/Q-Instruct

Awesome-CVPR2024-Low-Level-Vision