Logo

#CVPR2024

Logo of CVPR2024-Paper-Code-Interpretation
CVPR2024-Paper-Code-Interpretation
获取CVPR 2024最新论文的下载链接和详细解读。持续更新的内容包括技术直播分享、论文分类汇总及各研究方向的深入分析,帮助用户快速了解计算机视觉领域的最新动态。
Logo of LangSplat
LangSplat
LangSplat是一种创新的3D语言高斯点云渲染技术,融合3D场景重建和自然语言处理。该技术引入场景级语言自动编码器,降低内存需求,实现高效语言特征建模。项目提供完整训练流程,涵盖特征生成、自动编码器训练和模型优化,支持研究者在自定义场景中应用LangSplat。
Logo of ViP-LLaVA
ViP-LLaVA
ViP-LLaVA项目旨在提升大型多模态模型对任意视觉提示的理解能力。通过在原始图像上叠加视觉提示进行指令微调,该方法使模型能更好地处理多样化的视觉输入。项目还开发了ViP-Bench,这是首个零样本区域级基准,用于评估多模态模型性能。ViP-LLaVA提供完整的训练流程、模型权重和演示,为视觉语言模型研究提供了有力支持。
Logo of MIGC
MIGC
MIGC项目的多实例生成控制器提升了文本生成图像的多样性和质量,包含COCO-MIG基准测试、在线Colab演示等资源。MIGC提升了属性控制,通过更换不同生成器权重,实现高质量和多样化图像生成。最新Consistent-MIG算法优化迭代编辑功能,保持未修改区域一致性并增强修改实例的一致性。此项目由浙江大学的ReLER实验室和华为监督。
Logo of StableVITON
StableVITON
StableVITON是一个基于潜在扩散模型的虚拟试穿项目,专注于学习语义对应以实现高质量的虚拟试穿效果。该项目提供推理和训练代码,以及预训练模型权重,支持配对和非配对虚拟试穿,并可通过重绘选项保留未遮罩区域。StableVITON在VITON-HD数据集上训练,引入ATV损失提升模型性能。这一开源项目为虚拟试穿技术研究提供了有力工具。