2024年CVPR低层视觉方向优秀论文和代码汇总
我正在与Kobaayyy合作收集2024年CVPR低层视觉相关的论文和代码。
请点击这里查看。
低层视觉相关汇总
- 2023年CVPR低层视觉方向优秀论文
- 2022年CVPR低层视觉方向优秀论文
- 2023/2021年ICCV低层视觉方向优秀论文
- 2023-2021年NeurIPS低层视觉方向优秀论文
- 2023/2022年AAAI低层视觉方向优秀论文
- 2022年ECCV低层视觉方向优秀论文
概览
图像恢复
图像重建
HIR-Diff: 基于改进扩散模型的无监督高光谱图像恢复
视频恢复
从实践中获取真知:用于视频恶劣天气去除的扩散测试时间自适应
超分辨率
图像超分辨率
CAMixerSR: 只有细节需要更多"注意力"
SinSR: 单步扩散图像超分辨率
视频超分辨率
FMA-Net: 用于联合视频超分辨率和去模糊的基于光流引导的动态滤波和迭代特征细化多注意力网络
通过隐式重采样对齐增强视频超分辨率
去模糊
视频去模糊
FMA-Net: 用于联合视频超分辨率和去模糊的基于光流引导的动态滤波和迭代特征细化多注意力网络
模糊感知时空稀疏Transformer用于视频去模糊
图像编辑
PAIR-Diffusion: 全面的多模态对象级图像编辑器
使用自然语言的无反演图像编辑
专注于你的指令:通过注意力调制实现细粒度和多指令图像编辑
编辑一个适用于所有:交互式批量图像编辑
MACE: 扩散模型中的批量概念擦除
视频编辑
VidToMe: 用于零样本视频编辑的视频令牌合并
图像生成/合成 / 图像到图像转换
文本到图像 / 文本引导 / 多模态
PIA: 你的个性化图像动画师,通过文本到图像模型的即插即用模块
SVGDreamer: 使用扩散模型的文本引导SVG生成
- 论文: https://arxiv.org/abs/2312.16476
- 代码: https://github.com/ximinng/SVGDreamer ECLIPSE:重新审视文本到图像先验以实现高效图像生成
- 论文:https://arxiv.org/abs/2312.04655
- 代码:https://github.com/eclipse-t2i/eclipse-inference
智能格林 -- 通过潜在扩散模型进行开放式视觉讲故事
DreamMatcher:语义一致的文本到图像个性化的外观匹配自注意力
InstanceDiffusion:图像生成的实例级控制
InteractDiffusion:文本到图像扩散模型的交互控制
- 论文:https://arxiv.org/abs/2312.05849
- 代码:https://github.com/jiuntian/interactdiffusion?tab=readme-ov-file
图像到图像 / 图像引导
姿势引导人物图像合成的粗到细潜在扩散
其他图像生成
残差去噪扩散模型
DemoFusion:无需高昂成本实现高分辨率图像生成的民主化
ElasticDiffusion:无需训练的任意尺寸图像生成
DeepCache:免费加速扩散模型
视频生成
MagicAnimate:使用扩散模型进行时间一致的人物图像动画
VMC:使用时间注意力适应的文本到视频扩散模型进行视频运动定制
EvalCrafter:大型视频生成模型的基准测试和评估
说话人头生成
SyncTalk:说话人头合成中的魔鬼在于同步
[返回概览]
其他
Q-Instruct:提高多模态基础模型的低级视觉能力