Awesome-Diffusion-Models

扩散模型资源与研究的全面综述

Diffusion Models 机器学习图像生成自然语言处理数据生成 Github 开源项目

提供全面的扩散模型资源与研究论文，包括入门帖子、视频、讲座和教程笔记本。涵盖图像生成、分类、分割、音频处理和自然语言处理等应用领域，适用于机器学习和深度学习研究者。访问本页，获取更多详细信息与最新进展，提升对扩散模型的理解与应用。

pytorch-stable-diffusion - 从零完成Stable Diffusion的PyTorch实现

该项目通过PyTorch从头实现Stable Diffusion，包括权重和tokenizer文件的下载链接，以及微调模型的下载指南。特别感谢多个相关开源项目的支持，完善此实现。

DragDiffusion - 基于扩散模型的交互式图像编辑工具

DragDiffusionGithub交互式人工智能图像编辑开源项目扩散模型

DragDiffusion结合扩散模型和交互式编辑，允许用户通过拖拽操作修改图像。支持真实和生成图像编辑，集成LoRA训练、自定义VAE和FreeU技术，提高编辑质量和效率。这个研究项目为图像处理提供了新的方法和工具。

imagedream-ipmv-diffusers - 多视角扩散模型用于3D图像生成

3D生成GithubHuggingfaceMVDream-diffusers使用限制图像扩散开源项目模型

该项目是ImageDream模型在diffusers中的移植版本，展示了基于图像提示的多视角扩散技术在3D生成中的能力。用户可前往GitHub获得使用指南。由Wang及其团队发布于2023年的arXiv。请注意，模型禁止用于生成或传播可能引发敌对环境的图像，或传播可能会打扰、困扰或冒犯公众，以及涉及历史或当代偏见的内容。

DocDiff - 基于残差扩散模型的轻量级文档图像增强工具

DocDiffGithub图像处理开源项目扩散模型文档增强深度学习

DocDiff是一个基于残差扩散模型的轻量级文档增强工具，用于文档去模糊、去噪、二值化和去水印等任务。该模型在128*128分辨率上训练仅需12GB显存。除文档处理外，DocDiff还适用于自然场景图像处理和语义分割。项目提供完整代码和预训练模型，便于快速实现和应用。

stable-diffusion-pytorch - Stable Diffusion PyTorch实现，支持自定义参数

该项目提供简洁且易于修改的Stable Diffusion PyTorch实现，支持文本生成图像与图像生成图像的操作，允许自定义生成参数、调整指导规模和选择生成步数等多种功能。依赖PyTorch、Numpy和Pillow等库，适合需要高度控制与灵活性的深度学习项目。通过Colab可以快速开始使用，并且借鉴了多个知名开源库，是学习和实践的理想资源。

awesome-ai-ml-dl - 涵盖人工智能、机器学习和深度学习的综合资源和学习平台

AIDLGithubJavaMLNLP开源项目

awesome-ai-ml-dl项目集中于人工智能、机器学习及深度学习领域，提供全面的学习笔记与精选资源。适用于工程师、开发者和数据科学家等专业人员，帮助他们更有效地获取知识和资源。此项目促进了学习的乐趣并使相关资料易于获取。

awesome-knowledge-distillation - 知识蒸馏技术研究论文资源集锦

AIGithub开源项目模型压缩深度学习知识蒸馏神经网络

项目汇集了知识蒸馏领域的学术论文，内容丰富全面。资源从早期神经网络集成研究到当前前沿方法，涉及模型压缩、迁移学习等多个相关方向。对于深入研究知识蒸馏技术的学者和工程师而言，这是一个系统化的参考资料库。

awesome-ai-art-image-synthesis - AI图像生成与提示工程工具集合

AI ArtDalle2GithubMidJourneyPrompt EngineeringStableDiffusion开源项目

全面介绍Dalle2、MidJourney、StableDiffusion等AI图像生成工具和技术。提供适合初学者和高级用户的实用工具、提示和技巧，以及丰富的资源，包括商业和开源模型、提示工程工具、后处理工具和社区支持。无论是了解如何使用这些工具生成图像，还是寻找灵感和学习资源，这里都能满足需求。

video-diffusion-pytorch - 开源项目实现文本到视频生成新突破

GithubPytorchU-net开源项目文本到视频深度学习视频生成

video-diffusion-pytorch项目实现了基于扩散模型的文本到视频生成技术。该开源项目采用时空分解U-net结构，将2D图像生成扩展至3D视频领域。支持文本条件生成、BERT编码和批量训练等功能。目前在移动MNIST数据集上表现良好，为研究人员和开发者提供了探索视频生成新前沿的工具。该技术有望在复杂视频生成任务中取得进展。

Stable-Diffusion - 关于稳定扩散和SDXL的专家级教程

Automatic1111 Web UIDreamBoothGithubLoRAStable Diffusion开源项目教程视频

探索Dr. Furkan Gözükara领导的Stable Diffusion项目。通过全面的高级教程视频，涵盖自动化Web UI安装至模型训练，与我们一起从基础到专家，深入理解并运用Stable Diffusion技术。包含Google Colab和Automatic1111 Web UI的实操演示，适合所有技术爱好者。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com