#高分辨率

pix2pixHD - 高分辨率图像到图像转换及语义编辑

Github开源项目图像翻译pix2pixHDGANs高分辨率语义操控

此Pytorch实现的高分辨率图像到图像转换方法（如2048x1024），可以将语义标签图转化为真实感图像，或从面部标签图生成肖像。该项目适用于街景和肖像等图像生成及交互编辑。需要NVIDIA GPU，提供详细的安装、测试和训练指南，支持多GPU和自动混合精度训练。

DemoFusion - 民主化高分辨率图像生成

Github开源项目开源图像生成高分辨率DemoFusion生成式人工智能

DemoFusion项目致力于通过优化现有开源生成式人工智能（GenAI）模型，普及高分辨率图像生成技术，减少高额资本投资需求。该框架利用渐进式放大、跳过残差和膨胀采样机制，实现高质量图像生成。DemoFusion的渐进生成过程提供中间预览结果，便于用户快速调整和迭代。此项目旨在对抗大公司垄断，让公众无需支付高昂费用即可使用尖端的高分辨率图像生成技术。

LGM - 多视图高斯模型实现高质量3D内容创建

Github开源项目高分辨率3D内容创建多视图高斯模型LGM

LGM是一种大规模多视图高斯模型,用于创建高分辨率3D内容。该模型可将文本或图像转换为高质量3D模型,并支持快速推理和训练。项目开源了完整代码、预训练权重和演示应用,为3D内容创作提供了实用工具。LGM在3D重建的精度和效率上有显著提升,推动了计算机图形学和视觉领域的发展。

Era3D - 基于高效行注意力的高分辨率多视图扩散模型

Github开源项目AI生成高分辨率3D重建Era3D多视图扩散

Era3D是一个高分辨率多视图扩散模型，采用高效行注意力机制生成3D内容。该模型可从单张图像创建多视角数字人像，包括色彩和法线图像。项目开源了实现代码、预训练权重，并提供在线演示。Era3D在保持输出质量的同时提高了计算效率，为3D内容创作和计算机视觉研究提供了实用工具。

BiRefNet - 高分辨率图像分割的双边参考网络

Github开源项目Hugging Face图像分割高分辨率双边参考BiRefNet

BiRefNet是一个专注于高分辨率图像分割的创新网络。该项目在DIS、COD和HRSOD等多个高分辨率任务中取得了领先成果。BiRefNet采用双边参考机制提升分割精度，支持HuggingFace一行代码加载。项目开源了完整代码实现、预训练模型，并提供在线演示。这一工作为高分辨率图像分割研究带来了新的思路。

distrifuser - 高效分布式并行推理助力高分辨率图像生成

Github开源项目高分辨率GPU加速diffusion模型DistriFusion并行推理

DistriFusion是一种用于高分辨率扩散模型的分布式并行推理算法。该方法无需额外训练，通过多GPU协同工作加速推理过程，同时保持图像质量。其创新的补丁交互技术解决了传统方法的碎片化问题，在高分辨率图像生成任务中显著提升了性能。该项目已在CVPR 2024被评为亮点工作，并开源了相关代码。

HRDA - 突破性多分辨率域适应语义分割方法

Github开源项目语义分割高分辨率域适应HRDA多尺度

HRDA是一种创新的多分辨率训练方法，用于无监督域适应的语义分割。它结合高分辨率裁剪保留细节和低分辨率裁剪捕获长程上下文，同时控制GPU内存占用。HRDA在多个基准测试中显著超越现有方法，并可扩展至域泛化。这种方法为自动驾驶等实际应用中的域适应问题提供新思路，推动了计算机视觉技术在复杂场景下的应用。

BackgroundMattingV2 - 实时高分辨率背景抠图技术的创新突破

Github开源项目深度学习计算机视觉高分辨率实时处理背景抠图

该项目开发了实时高分辨率背景抠图技术，通过额外背景图像实现高质量抠图。研究展示了创新的神经网络架构，并提供新数据集。成果获CVPR 2021最佳学生论文荣誉提名，推动视频处理和图像编辑技术发展。

HiDiffusion - 无需训练即可提升扩散模型分辨率和速度的方法

Github开源项目AI绘图图像生成扩散模型高分辨率HiDiffusion

HiDiffusion是一种提高预训练扩散模型分辨率和速度的方法，无需额外训练。通过添加单行代码即可集成到现有扩散管道中。它支持文本到图像、图像到图像和修复等多种任务，适用于Stable Diffusion XL、Stable Diffusion v2等主流模型。HiDiffusion还兼容ControlNet等下游任务，为图像生成提供更高质量和效率。

AOT-GAN-for-Inpainting - 基于聚合上下文变换的高分辨率图像修复技术

Github开源项目图像修复生成对抗网络高分辨率AOT-GAN上下文转换

AOT-GAN for Inpainting项目提出了一种创新的图像修复模型，旨在解决高分辨率图像中大面积缺失区域的修复问题。该模型结合了聚合上下文变换(AOT)块和SoftGAN技术，分别增强了上下文推理能力和纹理合成质量。AOT块能够有效捕捉远距离上下文信息和丰富的特征模式，而SoftGAN则通过改进判别器训练，提高了真实和合成图像细节的识别能力。这种方法在面部、物体和场景图像的高质量修复上取得了显著成效。

ImgGen AI - AI文本转图像工具免费生成高质量无水印图片

AI绘图图像生成AI工具高分辨率免费工具ImgGen

ImgGen AI提供免注册的在线图像生成服务，支持文本到图像的快速转换。除基本的AI图像生成功能外，还集成了肖像锐化、老照片修复、色彩校正和图像去模糊等多种图像处理工具。该平台操作简单，适合各类创意工作者使用，可免费生成高分辨率无水印图片。

BetterImage.AI - 在线AI图像增强和放大服务

AI图像增强AI工具在线工具免费使用高分辨率图片放大

BetterImage.AI为用户提供在线AI图像增强服务，支持将低分辨率图片提升至4K，优化照片细节。该工具适用于多种场景，如人像美化、老照片修复和电商产品图优化。用户每天可免费处理5张图片，付费订阅则可获得更高分辨率输出。通过先进AI技术提升整体清晰度，并针对亚洲面部特征进行优化，确保快速安全的图像处理体验。

UI Faces - 高分辨率AI头像资源库为设计原型提供多样化选择

AI工具设计模板AI头像高分辨率Figma插件免费资源

UI Faces是一个持续扩展的AI生成头像库，为设计原型和创意项目提供免费、高分辨率的头像素材。网站内容经过细致分类，方便设计师快速找到所需资源。平台已得到20多万设计师的认可，同时提供Figma插件以简化设计流程。UI Faces的多元化头像资源能够帮助设计师制作出更具视觉吸引力的作品。

Picogen - 多功能AI图像处理API服务

AI绘图图像生成AI工具API集成高分辨率Picogen

Picogen提供AI图像生成API服务，包括4K分辨率图像生成、图像融合、背景移除和8K图像放大。作为Midjourney、Stable Diffusion和DALL-E的替代方案，Picogen支持多语言，提供灵活定价。API可在5分钟内完成集成，适用于营销、设计、内容创作和电商等领域。Picogen旨在提供高质量、多功能的AI图像处理解决方案。

Upscayl - 免费开源的AI图像放大工具提升照片清晰度

UpscaylAI图像增强开源软件图像处理AI工具高分辨率

Upscayl是一款免费开源的AI图像放大工具，可将低分辨率照片转换为高清晰度图像。它提供桌面和云端版本，支持批量处理和最高16倍的分辨率提升。该工具界面直观，功能多样，适用于创作者、设计师和企业等用户。Upscayl能有效提升图片质量，满足各种图像优化需求。

Pictura - macOS原生照片增强应用提升图像清晰度和细节

AI图像增强AI工具高分辨率Mac应用照片编辑Pictura

Pictura是一款macOS原生照片增强应用，能将低分辨率图像提升至4倍清晰度。支持普通照片和动漫图像处理，采用拖放操作方式，通过Mac神经引擎优化性能。应用在本地设备上进行图像处理，确保用户隐私安全。

VITON-HD - 实现高分辨率虚拟试衣的新方法

Github开源项目深度学习虚拟试衣图像合成高分辨率VITON-HD

VITON-HD是一个创新的虚拟试衣项目，能够生成1024x768高分辨率的虚拟试衣图像。该项目通过ALIAS归一化和生成器技术解决了高分辨率下的图像错位问题，同时保留了输入图像的细节。与现有方法相比，VITON-HD在合成图像质量方面有明显提升，为虚拟试衣技术的发展提供了新的研究方向。

LLaVA-HR - 混合分辨率适应技术助力多模态大模型

Github开源项目大语言模型多模态高分辨率视觉语言任务LLaVA-HR

LLaVA-HR是一个采用混合分辨率适应技术的多模态大语言模型。它支持1536x1536的高分辨率图像输入,提高了细粒度视觉语言任务的性能。该模型在保持与LLaVA-1.5相近训练成本的同时,在多个基准测试中表现出色。LLaVA-HR为研究社区提供了一个新的基线,展示了混合分辨率适应方法在提升多模态模型性能方面的潜力。

awesome-remote-sensing-change-detection - 遥感变化检测数据集与代码资源汇总

Github开源项目深度学习数据集高分辨率遥感变化检测多光谱

项目整理了遥感变化检测领域的关键资源,包括数据集、算法代码和竞赛信息。数据类型覆盖多光谱、高光谱和3D等,同时收录了传统方法和深度学习的实现代码。为该领域研究和应用提供全面参考,内容持续更新。

moeFussion - 精准生成萌系角色的AI项目革新

Github开源项目图像生成模型高分辨率Huggingface动漫角色样式改进Moe Diffusion

moeFussion项目旨在改进萌系角色生成，通过整合多个版本实现高分辨率和风格多样性。基于Stable Diffusion 2.1-768的实验方法，该项目增强了复杂背景处理和多角色生成，改良了合成与人体结构的协调性。支持PastelMix和Counterfeit等多种风格，以较高的手部表现能力为特色。用户可使用正负提示词如“anime”和“best quality”实现最佳生成效果。通过多个版本更新，解决风格继承及合成问题，并提供在Yodayo和Aipictors平台生成的示例图像。

TempestV0.1 - 基于600万图像数据的超高分辨率AI生成引擎

Github开源项目深度学习人工智能模型图像生成模型高分辨率HuggingfaceTempestV0.1

TempestV0.1是一个基于600万张高质量图像数据集训练的AI图像生成模型。它支持1400x2100至4800x7200的超高分辨率输出，经过300万次迭代训练，在细节和纹理表现上有出色表现。该模型提供Base和Artistic两个版本：Base版本生成连贯的图像，Artistic版本则具有更强的艺术表现力。TempestV0.1适用于需要高分辨率、高质量图像输出的各种场景。

epiCEpic - 增强图像生成与背景一致性的多功能工具

Github开源项目AI绘图模型创意设计文本到图像高分辨率Huggingfaceepic-diffusion

epiCEpic通过结合Epic Diffusion 1.0和epiCDream，提升了图像生成的背景一致性和细节表现。该工具支持创建从科幻到自然景观的高分辨率图像，展现出在多领域的多功能性，适用于视觉艺术的多种需求。其结合了稳定扩散技术与精致的艺术表现，助力创意与创新。

karlo-v1-alpha - 文本驱动的超分辨率图像生成

Github开源项目图像生成模型文本到图像高分辨率Huggingface超分辨率Karlo

Karlo v1 alpha利用OpenAI的unCLIP架构实现文本条件下的图像生成。通过改进的超分辨率模块，该模型在有限的去噪步骤中将图像分辨率从64px提升至256px。Karlo在COYO-100M、CC3M和CC12M等数据集上训练，具备优良的图像生成效果，并采用前置、解码及超分辨率模块实现高效处理。还支持生成图像变化，丰富视觉体验。

BiRefNet_lite - 高效双边参考处理解锁高分辨率图像分割技术

Github开源项目模型图像分割高分辨率HuggingfaceBiRefNet二分法迷彩物体检测

BiRefNet是一种基于双边参考的高分辨率二分类图像分割模型，在DIS、HRSOD和COD三项任务中表现出色。该模型支持高分辨率图像处理，提供Python接口和在线推理演示。用户可通过HuggingFace快速加载或选择本地部署。BiRefNet适用于背景去除、显著目标检测等多种图像分割场景，具有较强的通用性。

controlnet-scribble-sdxl-1.0 - 支持多种线条样式的高分辨率图像生成模型

Github开源项目图像生成模型高分辨率Huggingface线稿视觉美感ControlNet_SDXL

该模型能够生成与Midjourney效果相近的高分辨率图像。其通过超过千万张高质量图像数据的训练，采用多重分辨率和数据增强技术，支持各种类型和宽度的线条。用户可利用简单的草图和提示词生成视觉效果突出的图像。在美学表现上，该模型优于Controlnet-Canny-Sdxl-1.0。但需注意，线条的厚薄会影响控制能力，适合从粗略到精细的逐步创作。

相关文章

Article Cover

pix2pixHD: 高分辨率图像合成与语义操作的条件生成对抗网络

Article Cover

DemoFusion: 开源高分辨率图像生成的新时代

Article Cover

LGM: 大规模多视角高斯模型 - 高分辨率3D内容创作的新突破

Article Cover

Era3D: 高分辨率多视图扩散模型的革新性突破

Article Cover

BiRefNet: 高分辨率图像二分割的双边参考网络

Article Cover

AOT-GAN: 一种高分辨率图像修复的先进方法

Article Cover

AOT-GAN: 一种革新性的高分辨率图像修复方法

Article Cover

DistriFusion: 革新高分辨率扩散模型的分布式并行推理

Article Cover

HRDA: 一种高分辨率域自适应语义分割方法

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号