BrushNet

双分支扩散结构实现即插即用图像修复模型

BrushNet是一种新型图像修复模型，采用双分支扩散结构，可集成到预训练扩散模型中。通过分离遮罩图像特征和噪声潜在表示，并对预训练模型实施像素级控制，提高了图像修复效果。该模型适用于通用场景和特定应用，为图像编辑和生成提供了新的解决方案。

访问官网

CycleISP - 基于改进数据合成的图像修复框架

CycleISPGithub图像去噪开源项目数据合成深度卷积神经网络相机成像管道

CycleISP框架通过改进的数据合成方法，为图像去噪提供了大规模真实数据对。在RAW和sRGB空间中，模拟相机成像管道，生成信号依赖噪声的图像对，提升了深度卷积神经网络在真实相机数据集上的表现。相比之前的最佳方法，模型参数减少了约5倍。该框架适用于图像去噪和立体电影中的颜色匹配等任务，确保在多种图像处理任务中的优异性能。

RestoreFormer - 盲脸修复的跨域注意力模型

GithubRestoreFormer++人脸修复开源项目深度学习盲恢复高质量

RestoreFormer利用多头交叉注意力层实现高质量盲脸修复，其特点是从高质量字典中提取关键-值对用于面部重建。2023年9月项目添加了在线演示和更用户友好的推理方法，2023年1月新增了测试数据集。源代码和资源在GitHub提供，并包含详细的数据集准备和模型训练指南，支持多种评估指标。

inpaint - 开源图像修复与对象移除库

C++库GithubInpaintOpenCV图像修复对象移除开源项目

Inpaint是一个开源C++库,实现图像修复和完成功能。它侧重于大面积图像重建和对象移除,能够恢复或修复图像区域,使修改后的图像看起来自然。该库针对大区域重建进行了优化,可有效去除图像中不需要的元素。Inpaint支持多平台构建,并提供交互式工具用于图像编辑和修复。

inpaint-anything - AI驱动智能图像编辑点击实现精准修复

AI绘图GithubInpaint AnythingSegment Anything图像修复开源项目深度学习

Inpaint Anything是一款结合Segment Anything分割技术和稳定扩散修复能力的AI图像编辑工具。通过简单点击创建精确蒙版，提高修复效率和质量。支持SAM 2、SAM-HQ和FastSAM等多种模型，适用于多种图像类型。工具提供蒙版扩展、裁剪和迭代修复等调整选项，实现灵活强大的图像编辑。

DesignEdit - 基于多层潜在表示的统一精准图像编辑框架

DesignEditGithubStable Diffusion人工智能图像编辑多层潜在分解开源项目

DesignEdit是一个创新图像编辑项目，采用多层潜在表示技术实现统一精准的编辑功能。支持对象移除、缩放、平移、移动、调整大小和翻转等操作，还可进行跨图像合成和排版重设。基于Stable Diffusion XL 1.0实现，无需额外训练即可使用。项目提供Gradio交互界面，简化了复杂的图像编辑过程。这个开源项目展示了AI在图像编辑领域的应用前景。

StableSR - 通过扩散模型实现实际应用中的图像超分辨率

GithubHugging FaceStableSR图像超分辨率开源项目扩散模型模型训练

StableSR项目采用扩散模型，提高了真实世界场景中的图像超分辨率效果。最新更新包括对SD-Turbo的支持以及与ComfyUI和Hugging Face平台的集成。用户可以通过各种平台体验和测试该项目的功能。项目提供了详细的文档、代码示例和训练脚本，已被IJCV期刊接受，并在多个公开数据集中展示了其性能和效果。

Restormer - 高效Restormer Transformer实现高分辨率图像修复

GithubRestormerTransformer图像去噪图像去雨开源项目高分辨率图像恢复

研究提出了一种名为Restormer的高效Transformer模型，通过多头注意力和前馈网络设计，实现了长距离像素交互，适用于大图像处理。该模型在图像去雨、单图像运动去模糊、散焦去模糊（单图像和双像素数据）和高斯及真实图像去噪等任务中表现优异。Restormer的训练代码和预训练模型已发布，并被选为CVPR 2022的口头报告。用户可通过Colab或命令行测试预训练模型。

sd-controlnet-depth - 结合深度估计的文本到图像扩散模型

ControlNetGithubHuggingface图像生成开源项目条件控制模型深度估计稳定扩散

ControlNet通过深度估计条件增强了Stable Diffusion等模型，允许在个人设备和高性能集群上进行快速训练，即使数据集较小。开发者Lvmin Zhang与Maneesh Agrawala提出的模型具有灵活性，加强了扩散模型的控制方式，推进应用实现。其多种检查点以不同条件训练，提供精细的生成控制。

control_v11p_sd15_softedge - 软边缘检测控制模型优化稳定扩散图像生成效果

ControlNetGithubHuggingface图像生成开源项目条件控制模型稳定扩散软边缘

control_v11p_sd15_softedge是基于ControlNet v1.1的软边缘检测图像控制模型。它能精确控制Stable Diffusion的图像生成过程，支持多种图像处理任务。相比前代模型，优化了训练数据集，提升了边界感知能力，解决了灰度图像过拟合问题，具有更强的鲁棒性。该模型可用于艺术创作、图像编辑等领域，为用户提供更灵活的图像生成控制。

fbrs_interactive_segmentation - 基于反向传播细化的交互式图像分割算法

GithubPyTorchf-BRS交互式分割开源项目深度学习计算机视觉

f-BRS是一种基于反向传播细化的交互式图像分割算法。该项目提供了PyTorch实现,支持ResNet和HRNet等多种骨干网络。算法通过用户点击交互实现精确对象分割,在GrabCut、Berkeley等多个数据集上进行了评估。项目还提供了图形界面演示。f-BRS在分割精度和速度方面均有显著提升,为计算机视觉领域提供了新的解决方案。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com