image-super-resolution

Keras实现的高质量图像超分辨率，支持多种网络结构和训练脚本

Image Super-Resolution Keras Residual Dense Networks PSNR GAN Github 开源项目

本项目旨在通过实现多种残差密集网络（RDN）和残差在残差密集网络（RRDN）来提升低分辨率图像的质量，并支持Keras框架。项目提供了预训练模型、训练脚本以及用于云端训练的Docker脚本。适用于图像超分辨率处理，兼容Python 3.6，开源并欢迎贡献。

文档

DeepImage-an-Image-to-Image-technology - 强大而多样化的图像生成与转换技术集合

CycleGANDeepImageGANGithubImage-to-ImageStyleGAN开源项目

DeepImage是一个综合性的图像生成与转换技术项目，包含多种先进算法如pix2pixHD、pix2pix和CycleGAN等。该项目提供了图像生成演示、理论研究资料和实践指南，涵盖从基础到前沿的生成对抗网络(GAN)技术。DeepImage为研究人员和开发者提供了一个全面的学习和实验平台，助力探索图像生成与转换的多种可能性。

distill-sd - 更小更快速的Stable Diffusion模型，依靠知识蒸馏实现高质量图像生成

GithubStable Diffusion开源项目模型压缩神经网络训练细节预训练检查点

基于知识蒸馏技术开发的小型高速Stable Diffusion模型。这些模型保留了完整版本的图像质量，同时大幅减小了体积和提升了速度。文档详细介绍了数据下载脚本、U-net训练方法和模型参数设置，还支持LoRA训练及从检查点恢复。提供清晰的使用指南和预训练模型，适配快速高效图像生成需求。

ml-mdm - 开源框架实现高分辨率文本到图像生成模型

GithubMatryoshka Diffusion Models开源项目文本到图像生成深度学习神经网络模型高分辨率图像合成

ml_mdm是一个Python开源项目,实现了Matryoshka扩散模型技术用于文本到图像生成。该框架支持训练单个像素空间模型生成高达1024x1024分辨率的图像,开源了U-Net和嵌套U-Net的实现。项目提供预训练模型、Web演示和CC12M数据集上的训练教程,为高分辨率图像和视频合成提供完整解决方案。

multidiffusion-upscaler-for-automatic1111 - 生成与图像放大技术，适用于低显存环境

ControlNetDemofusionGithubTiled DiffusionVAEsd-webui开源项目

通过瓦片扩散与VAE技术，该扩展支持在有限显存条件下生成或放大超大图像（≥2K）。主要功能包括瓦片VAE、瓦片扩散、区域提示控制和噪声反演，并兼容ControlNet、StableSR和SDXL等高级功能。项目免费开放使用和修改，自2023.3.28起代码不得用于商业贩售。访问wiki页面获取更多详细文档和教程。

controlnet-tile-sdxl-1.0 - ControlNet技术在图像处理中的最新应用探索

ControlNet Tile SDXLGithubHuggingface人工智能图像去模糊图像超分辨率开源项目模型生成式图像处理

该项目展示了如何利用ControlNet技术实现图像的去模糊、变体生成和超分辨率处理。通过整合多种图像处理器和pipelines，支持多种比率和倍数的放大，简化了操作过程，并提高了图像质量。项目代码提供了应用高斯模糊、引导滤波及多维采样的示例，可以通过详细提示生成更高质量和多样化的图像，提高细节再现能力。

resnet50d.ra2_in1k - 基于ResNet-D架构的高效图像分类与特征提取模型

GithubHuggingfaceResNettimm图像分类开源项目模型深度学习神经网络

ResNet-D是一款在ImageNet-1k数据集训练的图像分类模型，采用ReLU激活函数和三层卷积结构，包含2560万参数。模型支持224x224尺寸训练输入和288x288测试输入，集成RandAugment增强技术，可实现图像分类、特征提取等计算机视觉任务。

HAT - 激活更多像素的图像超分辨率转换器

GithubHATTransformer图像超分辨率开源项目深度学习计算机视觉

HAT是一个开源的图像超分辨率项目，采用混合注意力转换器架构。它在Set5、Urban100等数据集上达到了最先进水平，参数量为20.8M。HAT还提供了小型模型版本和用于真实世界超分辨率的GAN模型，能够处理各种图像重建任务。

Upscale-A-Video - 基于扩散模型的时序一致视频超分辨率技术

AI视频处理GithubUpscale-A-VideoYouHQ数据集开源项目扩散模型视频超分辨率

Upscale-A-Video是一个视频超分辨率项目，采用扩散模型技术处理低分辨率视频和文本提示输入。该项目重点解决真实世界视频的时序一致性问题，并发布了YouHQ数据集用于模型训练和评估。Upscale-A-Video旨在提高视频分辨率的同时保持帧间连贯性。

stable-diffusion-x4-upscaler - 基于稳定扩散技术的AI图像4倍放大模型

GithubHuggingfaceStable Diffusion上采样人工智能图像生成开源项目机器学习模型

stable-diffusion-x4-upscaler是一个开源的AI图像放大模型,基于稳定扩散技术开发。它可以将图像分辨率提高4倍,同时保持图像质量。该模型支持文本引导,能根据描述优化放大效果。采用潜在扩散模型技术,在1000万张高分辨率图像上训练。适用于图像分辨率提升、艺术创作和图像编辑等领域。

AuraSR - GigaGAN驱动的智能图像放大工具

AI工具AuraSRGAN图像增强图像超分辨率隐私保护

AuraSR是一款基于GigaGAN的图像超分辨率工具，可将低分辨率图像放大4倍，且支持重复应用。该工具擅长处理文本生成的图像，支持PNG、JPG、JPEG和WEBP格式输入，输出高清WEBP格式。AuraSR重视数据安全，提供社交媒体分享功能。目前免费使用，未来将推出付费计划，提供更多高级功能。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com