Project Icon

sd-controlnet-mlsd

结合M-LSD直线检测优化Stable Diffusion的图像生成

该项目介绍了ControlNet神经网络结构,通过加入M-LSD直线检测等条件来控制大规模扩散模型,适用于Stable Diffusion。ControlNet能够在小数据集下进行稳健学习,且可在个人设备上快速训练。项目提供了多种检查点,涵盖边缘检测、深度估计和关键点检测,丰富了大规模扩散模型的控制方式,有助于推进相关应用的发展,最佳效果在Stable Diffusion v1-5结合使用时体现。

sd-vae-ft-mse - 改进稳定扩散自编码器提升图像重建效果
GithubHuggingfaceStable Diffusion图像生成开源项目模型模型微调深度学习自动编码器
sd-vae-ft-mse是一款经过微调的稳定扩散自编码器,在LAION-Aesthetics和LAION-Humans数据集上训练。该模型旨在提高图像重建质量,尤其是人脸细节。相比原始模型,它在PSNR和SSIM等指标上有明显提升,能够生成更平滑的图像。该模型可作为VAE组件轻松集成到现有的diffusers工作流中,用于稳定扩散图像生成。
mklan-aio-nsfw-aio-nextgen-xlv2-sdxl - Stable Diffusion XL图像模型实现真实与动漫风格融合
AI绘画GithubHuggingfaceStable Diffusion动漫开源项目文生图模型真实感
基于Stable Diffusion XL开发的图像生成模型,整合了真实感和动漫风格的表现特点。模型通过diffusers框架实现文本到图像的转换,可用于生成写实照片、动漫角色、游戏场景和动物图像等多种类型的内容
stable-diffusion-2-1-unclip - 基于文本和图像嵌入的Stable Diffusion 2.1增强版
GithubHuggingfaceStable Diffusion图像生成开源项目模型模型卡训练数据限制与偏见
Stable Diffusion 2.1的增强版可接受CLIP图像嵌入并生成图像变体,通过噪声水平调节控制。适用于艺术创作、设计和研究用途,探索生成模型的偏见和局限。开发者为Robin Rombach和Patrick Esser,使用CreativeML Open RAIL++-M开放许可,但需注意生成的内容可能存在偏见或不当风险。
Awesome-Controllable-Generation - 可控生成技术前沿 ControlNet到DreamBooth及最新进展
Github人工智能可控生成开源项目扩散模型文本到图像深度学习
该项目收集了扩散模型中可控生成的前沿论文和资源,涵盖ControlNet、DreamBooth等开创性工作及图像、视频、3D生成的最新应用。内容包括精细合成控制、主题驱动生成和复杂布局操作等技术,汇集80余篇精选论文,全面覆盖可控生成领域的多种技术和应用,为相关研究者提供重要参考。
stable-diffusion-colab - Stable Diffusion Hyper-SDXL模型在Colab上的简易部署与使用
AI绘图ColabGithubStable Diffusion开源项目文本生成图像深度学习
该项目为Stable Diffusion Hyper-SDXL模型提供了Colab部署方案。用户可通过简单的文本提示生成高分辨率创意图像,如火星上骑马的宇航员或埃菲尔铁塔前用餐的皮卡丘。项目采用先进的潜在扩散模型技术,并集成了LCM-LoRA加速模块,有效提升了图像生成效率。
stable-diffusion - 基于Habana Gaudi处理器实现高性能AI图像生成方案
GPU加速GithubHabanaHuggingfaceStable Diffusion人工智能开源项目模型混合精度训练
Stable Diffusion模型在Habana Gaudi处理器上的优化配置方案。该方案集成了Hugging Face生态系统,支持高效的模型训练和部署,可在单处理器或多处理器环境下运行,适用于需要高性能图像生成的应用场景。
testSCG-Anatomy-Flux1 - 文本到图像生成功能及稳定扩散技术概览
AI绘图GithubHuggingfaceSafetensorsstable-diffusion开源项目模型模型下载生成艺术
项目特色在于结合黑森林实验室的FLUX.1基础模型,采用LoRA和diffusers技术以实现高效的文本到图像转换。支持Safetensors格式的模型权重下载,能够处理多领域的图像生成任务,适用于视觉设计和创意行业。通过应用先进技术,提升图像生成的性能和可靠性。
Flux.1-dev-Controlnet-Upscaler - 基于ControlNet的Flux.1-dev兼容图像超分辨率模型
ControlNetGithubHuggingface人工智能图像增强图像处理图像超分辨率开源项目模型
Jasper研究团队开发的Flux.1-dev ControlNet超分辨率模型,专门处理低分辨率图像。采用合成复杂数据降质方案训练,可将图像分辨率提升4倍。基于diffusers库实现,支持高斯噪声、泊松噪声、图像模糊和JPEG压缩等多种图像降质处理。该模型与Flux.1-dev完全兼容,提供高质量的图像超分辨率功能。
Diffusion_models_from_scratch - 完整实现扩散模型的开源框架与教程
Diffusion模型GithubImageNetU-Net图像生成开源项目预训练模型
该项目提供了一个完整的扩散模型实现框架,包含DDPM、DDIM和无分类器引导模型。项目特点包括:基于ImageNet 64x64数据集的预训练模型、详细的环境配置和数据准备指南、全面的训练和推理脚本,以及多种模型架构和优化策略。开发者可以利用此框架轻松训练自定义扩散模型或使用预训练模型生成图像。
Real-Time-Latent-Consistency-Model - 实时潜在一致性模型,支持多种图像转换管道
CUDAControlNetDiffusersGithubLatent Consistency ModelLoRA开源项目
此项目展示了使用Diffusers进行图像转换的实时潜在一致性模型(LCM),支持img2img、txt2img、ControlNet等多种管道。需要CUDA和Python 3.10等环境支持,提供详细的安装指南和使用示例。LCM + LoRAs可以在极少步骤内完成推理,加快处理速度。项目支持Docker部署,并提供不同平台的实时演示链接。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号