Project Icon

controlnet-depth-sdxl-1.0

SDXL深度控制网络模型优化图像生成效果

controlnet-depth-sdxl-1.0是基于Stable Diffusion XL的深度控制网络模型,利用深度图引导图像生成。该模型在300万图像-文本对上训练700 GPU小时,采用fp16混合精度,支持高分辨率输出。项目提供详细使用说明和代码示例,便于集成到SDXL管道中,有助于提升生成图像的质量和细节。

x-flux - Flux模型的LoRA和ControlNet微调脚本
AI绘图ControlNetDeepSpeedFluxGithubLoRA开源项目
该项目为Flux图像生成模型提供LoRA和ControlNet微调脚本。使用DeepSpeed实现高效训练,并提供预训练检查点。包含详细的训练和推理指南,以及低内存模式和加速配置示例。项目计划未来发布更多ControlNet权重模型和IP-Adapters。
SeargeSDXL - ComfyUI中SDXL的自定义节点和工作流
ComfyUIGithubSDXL 1.0Searge-SDXL安装和更新开源项目新特性
SeargeSDXL项目通过整合SDXL 1.0基础和改进检查点,为ComfyUI提供了一体化的图像生成工作流。该项目支持多达5个Controlnet和Revision节点,进一步提升了高分辨率图像质量,并新增FreeU v2支持。更新内容涵盖了安装指南、所需检查点和模型的直接下载链接,以及详细的操作模式介绍。最新v4.3版本还优化了处理速度并修复了多个Bug,提升了图像生成效率。
StreamDiffusion - 高性能实时AI图像生成框架
AI绘图GithubStreamDiffusion图像处理实时生成开源项目深度学习
StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。
HiDiffusion - 无需训练即可提升扩散模型分辨率和速度的方法
AI绘图GithubHiDiffusion图像生成开源项目扩散模型高分辨率
HiDiffusion是一种提高预训练扩散模型分辨率和速度的方法,无需额外训练。通过添加单行代码即可集成到现有扩散管道中。它支持文本到图像、图像到图像和修复等多种任务,适用于Stable Diffusion XL、Stable Diffusion v2等主流模型。HiDiffusion还兼容ControlNet等下游任务,为图像生成提供更高质量和效率。
LLM-groundedDiffusion - 优化文本到图像合成的提示理解能力
GPT-4GithubHuggingFaceLLM-grounded DiffusionStable DiffusionTMLR开源项目
本项目通过将大型语言模型(LLM)与文本到图像扩散模型结合,提高了提示理解能力。LLM负责解析文本请求,生成中间表示如图像布局,最终通过稳定扩散模型生成高质量图像。项目支持多种生成方法和开源模型,用户可自行设置实现自托管,从而节约API调用成本。项目更新频繁,包括支持高分辨率生成和集成SDXL精炼器等功能。
SDXL Turbo - 革新性实时文本转图像AI技术
AI工具AI绘图SDXL Turbo文本生成图像深度学习计算机视觉
SDXL Turbo运用先进的对抗性稳定扩散蒸馏技术,实现单步快速生成高质量图像。此模型适用于实时应用场景,在艺术创作、教育研究等领域展现广泛前景。用户可通过在线平台免费体验SDXL Turbo,亲身感受AI即时图像生成的强大功能。
Depth-Anything - 大规模无标注数据驱动的强大单目深度估计模型
Depth AnythingGithub人工智能图像处理开源项目深度估计计算机视觉
Depth Anything是一款基于大规模数据训练的单目深度估计模型。它利用150万标注图像和6200万无标注图像进行训练,提供小型、中型和大型三种预训练模型。该模型不仅支持相对深度和度量深度估计,还可用于ControlNet深度控制、场景理解和视频深度可视化等任务。在多个基准数据集上,Depth Anything的性能超越了此前最佳的MiDaS模型,展现出优异的鲁棒性和准确性。
InstanceDiffusion - 实现精确实例级图像生成控制的突破性方法
GithubInstanceDiffusion图像生成实例级控制开源项目文本到图像条件生成
InstanceDiffusion为文本到图像的扩散模型引入精确的实例级控制。该技术支持每个实例的自由语言条件,可灵活指定实例位置,包括单点、涂鸦、边界框和实例分割掩码。相比现有技术,InstanceDiffusion在框输入的AP50上提升2.0倍,掩码输入的IoU提高1.7倍,为图像生成和编辑领域带来新的可能性。
diffae - 基于扩散模型的自编码器框架实现图像生成与编辑
Diffusion AutoencodersGithub图像处理开源项目深度学习生成模型计算机视觉
diffae项目实现了基于扩散模型的自编码器框架,用于高质量图像的生成和编辑。该项目提供多个预训练模型,支持FFHQ、LSUN等数据集,实现了无条件生成、图像操作和插值等功能。项目包含使用说明、模型检查点和针对不同数据集的训练脚本,为图像生成和编辑研究提供了完整的工具链。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号