Logo

#高分辨率

Logo of pix2pixHD
pix2pixHD
此Pytorch实现的高分辨率图像到图像转换方法(如2048x1024),可以将语义标签图转化为真实感图像,或从面部标签图生成肖像。该项目适用于街景和肖像等图像生成及交互编辑。需要NVIDIA GPU,提供详细的安装、测试和训练指南,支持多GPU和自动混合精度训练。
Logo of BiRefNet
BiRefNet
BiRefNet是一个专注于高分辨率图像分割的创新网络。该项目在DIS、COD和HRSOD等多个高分辨率任务中取得了领先成果。BiRefNet采用双边参考机制提升分割精度,支持HuggingFace一行代码加载。项目开源了完整代码实现、预训练模型,并提供在线演示。这一工作为高分辨率图像分割研究带来了新的思路。
Logo of HiDiffusion
HiDiffusion
HiDiffusion是一种提高预训练扩散模型分辨率和速度的方法,无需额外训练。通过添加单行代码即可集成到现有扩散管道中。它支持文本到图像、图像到图像和修复等多种任务,适用于Stable Diffusion XL、Stable Diffusion v2等主流模型。HiDiffusion还兼容ControlNet等下游任务,为图像生成提供更高质量和效率。
Logo of UI Faces
UI Faces
UI Faces是一个持续扩展的AI生成头像库,为设计原型和创意项目提供免费、高分辨率的头像素材。网站内容经过细致分类,方便设计师快速找到所需资源。平台已得到20多万设计师的认可,同时提供Figma插件以简化设计流程。UI Faces的多元化头像资源能够帮助设计师制作出更具视觉吸引力的作品。
Logo of VITON-HD
VITON-HD
VITON-HD是一个创新的虚拟试衣项目,能够生成1024x768高分辨率的虚拟试衣图像。该项目通过ALIAS归一化和生成器技术解决了高分辨率下的图像错位问题,同时保留了输入图像的细节。与现有方法相比,VITON-HD在合成图像质量方面有明显提升,为虚拟试衣技术的发展提供了新的研究方向。
Logo of DemoFusion
DemoFusion
DemoFusion项目致力于通过优化现有开源生成式人工智能(GenAI)模型,普及高分辨率图像生成技术,减少高额资本投资需求。该框架利用渐进式放大、跳过残差和膨胀采样机制,实现高质量图像生成。DemoFusion的渐进生成过程提供中间预览结果,便于用户快速调整和迭代。此项目旨在对抗大公司垄断,让公众无需支付高昂费用即可使用尖端的高分辨率图像生成技术。
Logo of distrifuser
distrifuser
DistriFusion是一种用于高分辨率扩散模型的分布式并行推理算法。该方法无需额外训练,通过多GPU协同工作加速推理过程,同时保持图像质量。其创新的补丁交互技术解决了传统方法的碎片化问题,在高分辨率图像生成任务中显著提升了性能。该项目已在CVPR 2024被评为亮点工作,并开源了相关代码。
Logo of AOT-GAN-for-Inpainting
AOT-GAN-for-Inpainting
AOT-GAN for Inpainting项目提出了一种创新的图像修复模型,旨在解决高分辨率图像中大面积缺失区域的修复问题。该模型结合了聚合上下文变换(AOT)块和SoftGAN技术,分别增强了上下文推理能力和纹理合成质量。AOT块能够有效捕捉远距离上下文信息和丰富的特征模式,而SoftGAN则通过改进判别器训练,提高了真实和合成图像细节的识别能力。这种方法在面部、物体和场景图像的高质量修复上取得了显著成效。
Logo of Picogen
Picogen
Picogen提供AI图像生成API服务,包括4K分辨率图像生成、图像融合、背景移除和8K图像放大。作为Midjourney、Stable Diffusion和DALL-E的替代方案,Picogen支持多语言,提供灵活定价。API可在5分钟内完成集成,适用于营销、设计、内容创作和电商等领域。Picogen旨在提供高质量、多功能的AI图像处理解决方案。
Logo of LLaVA-HR
LLaVA-HR
LLaVA-HR是一个采用混合分辨率适应技术的多模态大语言模型。它支持1536x1536的高分辨率图像输入,提高了细粒度视觉语言任务的性能。该模型在保持与LLaVA-1.5相近训练成本的同时,在多个基准测试中表现出色。LLaVA-HR为研究社区提供了一个新的基线,展示了混合分辨率适应方法在提升多模态模型性能方面的潜力。
Logo of LGM
LGM
LGM是一种大规模多视图高斯模型,用于创建高分辨率3D内容。该模型可将文本或图像转换为高质量3D模型,并支持快速推理和训练。项目开源了完整代码、预训练权重和演示应用,为3D内容创作提供了实用工具。LGM在3D重建的精度和效率上有显著提升,推动了计算机图形学和视觉领域的发展。
Logo of HRDA
HRDA
HRDA是一种创新的多分辨率训练方法,用于无监督域适应的语义分割。它结合高分辨率裁剪保留细节和低分辨率裁剪捕获长程上下文,同时控制GPU内存占用。HRDA在多个基准测试中显著超越现有方法,并可扩展至域泛化。这种方法为自动驾驶等实际应用中的域适应问题提供新思路,推动了计算机视觉技术在复杂场景下的应用。
Logo of ImgGen AI
ImgGen AI
ImgGen AI提供免注册的在线图像生成服务,支持文本到图像的快速转换。除基本的AI图像生成功能外,还集成了肖像锐化、老照片修复、色彩校正和图像去模糊等多种图像处理工具。该平台操作简单,适合各类创意工作者使用,可免费生成高分辨率无水印图片。
Logo of Upscayl
Upscayl
Upscayl是一款免费开源的AI图像放大工具,可将低分辨率照片转换为高清晰度图像。它提供桌面和云端版本,支持批量处理和最高16倍的分辨率提升。该工具界面直观,功能多样,适用于创作者、设计师和企业等用户。Upscayl能有效提升图片质量,满足各种图像优化需求。
Logo of awesome-remote-sensing-change-detection
awesome-remote-sensing-change-detection
项目整理了遥感变化检测领域的关键资源,包括数据集、算法代码和竞赛信息。数据类型覆盖多光谱、高光谱和3D等,同时收录了传统方法和深度学习的实现代码。为该领域研究和应用提供全面参考,内容持续更新。
Logo of Era3D
Era3D
Era3D是一个高分辨率多视图扩散模型,采用高效行注意力机制生成3D内容。该模型可从单张图像创建多视角数字人像,包括色彩和法线图像。项目开源了实现代码、预训练权重,并提供在线演示。Era3D在保持输出质量的同时提高了计算效率,为3D内容创作和计算机视觉研究提供了实用工具。
Logo of BackgroundMattingV2
BackgroundMattingV2
该项目开发了实时高分辨率背景抠图技术,通过额外背景图像实现高质量抠图。研究展示了创新的神经网络架构,并提供新数据集。成果获CVPR 2021最佳学生论文荣誉提名,推动视频处理和图像编辑技术发展。
Logo of BetterImage.AI
BetterImage.AI
BetterImage.AI为用户提供在线AI图像增强服务,支持将低分辨率图片提升至4K,优化照片细节。该工具适用于多种场景,如人像美化、老照片修复和电商产品图优化。用户每天可免费处理5张图片,付费订阅则可获得更高分辨率输出。通过先进AI技术提升整体清晰度,并针对亚洲面部特征进行优化,确保快速安全的图像处理体验。
Logo of Pictura
Pictura
Pictura是一款macOS原生照片增强应用,能将低分辨率图像提升至4倍清晰度。支持普通照片和动漫图像处理,采用拖放操作方式,通过Mac神经引擎优化性能。应用在本地设备上进行图像处理,确保用户隐私安全。