#高分辨率
pix2pixHD - 高分辨率图像到图像转换及语义编辑
Github开源项目图像翻译pix2pixHDGANs高分辨率语义操控
此Pytorch实现的高分辨率图像到图像转换方法(如2048x1024),可以将语义标签图转化为真实感图像,或从面部标签图生成肖像。该项目适用于街景和肖像等图像生成及交互编辑。需要NVIDIA GPU,提供详细的安装、测试和训练指南,支持多GPU和自动混合精度训练。
DemoFusion - 民主化高分辨率图像生成
Github开源项目开源图像生成高分辨率DemoFusion生成式人工智能
DemoFusion项目致力于通过优化现有开源生成式人工智能(GenAI)模型,普及高分辨率图像生成技术,减少高额资本投资需求。该框架利用渐进式放大、跳过残差和膨胀采样机制,实现高质量图像生成。DemoFusion的渐进生成过程提供中间预览结果,便于用户快速调整和迭代。此项目旨在对抗大公司垄断,让公众无需支付高昂费用即可使用尖端的高分辨率图像生成技术。
LGM - 多视图高斯模型实现高质量3D内容创建
Github开源项目高分辨率3D内容创建多视图高斯模型LGM
LGM是一种大规模多视图高斯模型,用于创建高分辨率3D内容。该模型可将文本或图像转换为高质量3D模型,并支持快速推理和训练。项目开源了完整代码、预训练权重和演示应用,为3D内容创作提供了实用工具。LGM在3D重建的精度和效率上有显著提升,推动了计算机图形学和视觉领域的发展。
Era3D - 基于高效行注意力的高分辨率多视图扩散模型
Github开源项目AI生成高分辨率3D重建Era3D多视图扩散
Era3D是一个高分辨率多视图扩散模型,采用高效行注意力机制生成3D内容。该模型可从单张图像创建多视角数字人像,包括色彩和法线图像。项目开源了实现代码、预训练权重,并提供在线演示。Era3D在保持输出质量的同时提高了计算效率,为3D内容创作和计算机视觉研究提供了实用工具。
BiRefNet - 高分辨率图像分割的双边参考网络
Github开源项目Hugging Face图像分割高分辨率双边参考BiRefNet
BiRefNet是一个专注于高分辨率图像分割的创新网络。该项目在DIS、COD和HRSOD等多个高分辨率任务中取得了领先成果。BiRefNet采用双边参考机制提升分割精度,支持HuggingFace一行代码加载。项目开源了完整代码实现、预训练模型,并提供在线演示。这一工作为高分辨率图像分割研究带来了新的思路。
distrifuser - 高效分布式并行推理助力高分辨率图像生成
Github开源项目高分辨率GPU加速diffusion模型DistriFusion并行推理
DistriFusion是一种用于高分辨率扩散模型的分布式并行推理算法。该方法无需额外训练,通过多GPU协同工作加速推理过程,同时保持图像质量。其创新的补丁交互技术解决了传统方法的碎片化问题,在高分辨率图像生成任务中显著提升了性能。该项目已在CVPR 2024被评为亮点工作,并开源了相关代码。
HRDA - 突破性多分辨率域适应语义分割方法
Github开源项目语义分割高分辨率域适应HRDA多尺度
HRDA是一种创新的多分辨率训练方法,用于无监督域适应的语义分割。它结合高分辨率裁剪保留细节和低分辨率裁剪捕获长程上下文,同时控制GPU内存占用。HRDA在多个基准测试中显著超越现有方法,并可扩展至域泛化。这种方法为自动驾驶等实际应用中的域适应问题提供新思路,推动了计算机视觉技术在复杂场景下的应用。
BackgroundMattingV2 - 实时高分辨率背景抠图技术的创新突破
Github开源项目深度学习计算机视觉高分辨率实时处理背景抠图
该项目开发了实时高分辨率背景抠图技术,通过额外背景图像实现高质量抠图。研究展示了创新的神经网络架构,并提供新数据集。成果获CVPR 2021最佳学生论文荣誉提名,推动视频处理和图像编辑技术发展。
HiDiffusion - 无需训练即可提升扩散模型分辨率和速度的方法
Github开源项目AI绘图图像生成扩散模型高分辨率HiDiffusion
HiDiffusion是一种提高预训练扩散模型分辨率和速度的方法,无需额外训练。通过添加单行代码即可集成到现有扩散管道中。它支持文本到图像、图像到图像和修复等多种任务,适用于Stable Diffusion XL、Stable Diffusion v2等主流模型。HiDiffusion还兼容ControlNet等下游任务,为图像生成提供更高质量和效率。
AOT-GAN-for-Inpainting - 基于聚合上下文变换的高分辨率图像修复技术
Github开源项目图像修复生成对抗网络高分辨率AOT-GAN上下文转换
AOT-GAN for Inpainting项目提出了一种创新的图像修复模型,旨在解决高分辨率图像中大面积缺失区域的修复问题。该模型结合了聚合上下文变换(AOT)块和SoftGAN技术,分别增强了上下文推理能力和纹理合成质量。AOT块能够有效捕捉远距离上下文信息和丰富的特征模式,而SoftGAN则通过改进判别器训练,提高了真实和合成图像细节的识别能力。这种方法在面部、物体和场景图像的高质量修复上取得了显著成效。
ImgGen AI - AI文本转图像工具 免费生成高质量无水印图片
AI绘图图像生成AI工具高分辨率免费工具ImgGen
ImgGen AI提供免注册的在线图像生成服务,支持文本到图像的快速转换。除基本的AI图像生成功能外,还集成了肖像锐化、老照片修复、色彩校正和图像去模糊等多种图像处理工具。该平台操作简单,适合各类创意工作者使用,可免费生成高分辨率无水印图片。
BetterImage.AI - 在线AI图像增强和放大服务
AI图像增强AI工具在线工具免费使用高分辨率图片放大
BetterImage.AI为用户提供在线AI图像增强服务,支持将低分辨率图片提升至4K,优化照片细节。该工具适用于多种场景,如人像美化、老照片修复和电商产品图优化。用户每天可免费处理5张图片,付费订阅则可获得更高分辨率输出。通过先进AI技术提升整体清晰度,并针对亚洲面部特征进行优化,确保快速安全的图像处理体验。
UI Faces - 高分辨率AI头像资源库 为设计原型提供多样化选择
AI工具设计模板AI头像高分辨率Figma插件免费资源
UI Faces是一个持续扩展的AI生成头像库,为设计原型和创意项目提供免费、高分辨率的头像素材。网站内容经过细致分类,方便设计师快速找到所需资源。平台已得到20多万设计师的认可,同时提供Figma插件以简化设计流程。UI Faces的多元化头像资源能够帮助设计师制作出更具视觉吸引力的作品。
Picogen - 多功能AI图像处理API服务
AI绘图图像生成AI工具API集成高分辨率Picogen
Picogen提供AI图像生成API服务,包括4K分辨率图像生成、图像融合、背景移除和8K图像放大。作为Midjourney、Stable Diffusion和DALL-E的替代方案,Picogen支持多语言,提供灵活定价。API可在5分钟内完成集成,适用于营销、设计、内容创作和电商等领域。Picogen旨在提供高质量、多功能的AI图像处理解决方案。
Upscayl - 免费开源的AI图像放大工具 提升照片清晰度
UpscaylAI图像增强开源软件图像处理AI工具高分辨率
Upscayl是一款免费开源的AI图像放大工具,可将低分辨率照片转换为高清晰度图像。它提供桌面和云端版本,支持批量处理和最高16倍的分辨率提升。该工具界面直观,功能多样,适用于创作者、设计师和企业等用户。Upscayl能有效提升图片质量,满足各种图像优化需求。
Pictura - macOS原生照片增强应用 提升图像清晰度和细节
AI图像增强AI工具高分辨率Mac应用照片编辑Pictura
Pictura是一款macOS原生照片增强应用,能将低分辨率图像提升至4倍清晰度。支持普通照片和动漫图像处理,采用拖放操作方式,通过Mac神经引擎优化性能。应用在本地设备上进行图像处理,确保用户隐私安全。
VITON-HD - 实现高分辨率虚拟试衣的新方法
Github开源项目深度学习虚拟试衣图像合成高分辨率VITON-HD
VITON-HD是一个创新的虚拟试衣项目,能够生成1024x768高分辨率的虚拟试衣图像。该项目通过ALIAS归一化和生成器技术解决了高分辨率下的图像错位问题,同时保留了输入图像的细节。与现有方法相比,VITON-HD在合成图像质量方面有明显提升,为虚拟试衣技术的发展提供了新的研究方向。
LLaVA-HR - 混合分辨率适应技术助力多模态大模型
Github开源项目大语言模型多模态高分辨率视觉语言任务LLaVA-HR
LLaVA-HR是一个采用混合分辨率适应技术的多模态大语言模型。它支持1536x1536的高分辨率图像输入,提高了细粒度视觉语言任务的性能。该模型在保持与LLaVA-1.5相近训练成本的同时,在多个基准测试中表现出色。LLaVA-HR为研究社区提供了一个新的基线,展示了混合分辨率适应方法在提升多模态模型性能方面的潜力。
awesome-remote-sensing-change-detection - 遥感变化检测数据集与代码资源汇总
Github开源项目深度学习数据集高分辨率遥感变化检测多光谱
项目整理了遥感变化检测领域的关键资源,包括数据集、算法代码和竞赛信息。数据类型覆盖多光谱、高光谱和3D等,同时收录了传统方法和深度学习的实现代码。为该领域研究和应用提供全面参考,内容持续更新。
moeFussion - 精准生成萌系角色的AI项目革新
Github开源项目图像生成模型高分辨率Huggingface动漫角色样式改进Moe Diffusion
moeFussion项目旨在改进萌系角色生成,通过整合多个版本实现高分辨率和风格多样性。基于Stable Diffusion 2.1-768的实验方法,该项目增强了复杂背景处理和多角色生成,改良了合成与人体结构的协调性。支持PastelMix和Counterfeit等多种风格,以较高的手部表现能力为特色。用户可使用正负提示词如“anime”和“best quality”实现最佳生成效果。通过多个版本更新,解决风格继承及合成问题,并提供在Yodayo和Aipictors平台生成的示例图像。
TempestV0.1 - 基于600万图像数据的超高分辨率AI生成引擎
Github开源项目深度学习人工智能模型图像生成模型高分辨率HuggingfaceTempestV0.1
TempestV0.1是一个基于600万张高质量图像数据集训练的AI图像生成模型。它支持1400x2100至4800x7200的超高分辨率输出,经过300万次迭代训练,在细节和纹理表现上有出色表现。该模型提供Base和Artistic两个版本:Base版本生成连贯的图像,Artistic版本则具有更强的艺术表现力。TempestV0.1适用于需要高分辨率、高质量图像输出的各种场景。
epiCEpic - 增强图像生成与背景一致性的多功能工具
Github开源项目AI绘图模型创意设计文本到图像高分辨率Huggingfaceepic-diffusion
epiCEpic通过结合Epic Diffusion 1.0和epiCDream,提升了图像生成的背景一致性和细节表现。该工具支持创建从科幻到自然景观的高分辨率图像,展现出在多领域的多功能性,适用于视觉艺术的多种需求。其结合了稳定扩散技术与精致的艺术表现,助力创意与创新。
karlo-v1-alpha - 文本驱动的超分辨率图像生成
Github开源项目图像生成模型文本到图像高分辨率Huggingface超分辨率Karlo
Karlo v1 alpha利用OpenAI的unCLIP架构实现文本条件下的图像生成。通过改进的超分辨率模块,该模型在有限的去噪步骤中将图像分辨率从64px提升至256px。Karlo在COYO-100M、CC3M和CC12M等数据集上训练,具备优良的图像生成效果,并采用前置、解码及超分辨率模块实现高效处理。还支持生成图像变化,丰富视觉体验。
BiRefNet_lite - 高效双边参考处理 解锁高分辨率图像分割技术
Github开源项目模型图像分割高分辨率HuggingfaceBiRefNet二分法迷彩物体检测
BiRefNet是一种基于双边参考的高分辨率二分类图像分割模型,在DIS、HRSOD和COD三项任务中表现出色。该模型支持高分辨率图像处理,提供Python接口和在线推理演示。用户可通过HuggingFace快速加载或选择本地部署。BiRefNet适用于背景去除、显著目标检测等多种图像分割场景,具有较强的通用性。
controlnet-scribble-sdxl-1.0 - 支持多种线条样式的高分辨率图像生成模型
Github开源项目图像生成模型高分辨率Huggingface线稿视觉美感ControlNet_SDXL
该模型能够生成与Midjourney效果相近的高分辨率图像。其通过超过千万张高质量图像数据的训练,采用多重分辨率和数据增强技术,支持各种类型和宽度的线条。用户可利用简单的草图和提示词生成视觉效果突出的图像。在美学表现上,该模型优于Controlnet-Canny-Sdxl-1.0。但需注意,线条的厚薄会影响控制能力,适合从粗略到精细的逐步创作。
相关文章