Project Icon

t2i-adapter-canny-sdxl-1.0

T2I适配器结合Canny检测提升稳定扩散XL的条件控制

T2I适配器通过Canny边缘检测增强稳定扩散模型的条件控制能力,由腾讯ARC和Hugging Face联合开发。该模型经由多任务学习在超过300万的高分辨率图文对上训练了20000步,实现了文本到图像生成的更高可控性。使用者需安装必要的依赖,并结合指定的模型与调度程序,以提高图像生成质量。

clip-guided-diffusion - 文本生成图像,多功能扩散模型
AI绘图CLIP Guided DiffusionGithubKatherine Crowsonpyglide图像生成开源项目
CLIP Guided Diffusion项目提供文本生成图像功能,支持多种参数和提示词权重设置。此项目采用高效扩散模型,通过命令行或Python接口操作,支持GPU加速,提供丰富的图像尺寸和调校选项,适合生成高质量多样化的视觉内容。
stable-diffusion-xl-demo - 基于Stable Diffusion XL的开源AI图像生成WebUI
GithubStable Diffusion XL图像生成开源项目机器学习深度学习生成式AI
stable-diffusion-xl-demo是基于Stable Diffusion XL 1.0的Gradio演示WebUI。该项目集成了LCM LoRA和SSD-1B模型,提高了图像生成速度。它提供简便的安装和启动方法,支持多GPU并行处理,并可在Colab上运行。相比SD v2.1,SDXL无需额外调整即可生成更高质量图像。此外,项目还提供多种内存优化和性能提升选项。
HiDiffusion - 无需训练即可提升扩散模型分辨率和速度的方法
AI绘图GithubHiDiffusion图像生成开源项目扩散模型高分辨率
HiDiffusion是一种提高预训练扩散模型分辨率和速度的方法,无需额外训练。通过添加单行代码即可集成到现有扩散管道中。它支持文本到图像、图像到图像和修复等多种任务,适用于Stable Diffusion XL、Stable Diffusion v2等主流模型。HiDiffusion还兼容ControlNet等下游任务,为图像生成提供更高质量和效率。
OnlyReal-Black-Mix - 利用文本到图像技术实现高效图像生成的创新解决方案
CivitaiGithubHugging FaceHuggingfacediffusersstable-diffusion图像生成开源项目模型
该项目结合稳定扩散模型与diffusers,支持文本转图像功能,适合多样化的创意应用场景。利用Hugging Face API生成的样本图像及原作者的演示,展示了其在艺术创作中的潜力与应用价值。
ADI-Stable-Diffusion - 基于ONNXRuntime的Stable Diffusion推理框架
C++GithubONNXRuntimeStable Diffusion开源开源项目推理引擎
ADI-Stable-Diffusion是一个C++库和命令行工具,利用ONNXRuntime加速Stable Diffusion模型推理。该项目具有小巧的包体积和高性能,支持多种采样方法和调度器,适用于不同版本的Stable Diffusion模型。它为开发者提供了便捷的工程部署方案,可用于构建灵活的图像生成和编辑应用。
axodox-machinelearning - 基于C++的Stable Diffusion图像生成库,支持ControlNet
C++ControlNetGithubONNXStable Diffusion图像合成开源项目
该库是一款基于Stable Diffusion的图像生成工具,支持txt2img、img2img和图像修复功能,完全采用C++实现,无需依赖Python。其高性能和简化的部署过程非常适用于实时图形应用和游戏开发。库还支持ControlNet,通过输入图像来引导生成过程,并提供GPU加速的特征提取功能,如姿势估计、深度估计和边缘检测。此外,库包含多个代码示例和预编译模型,便于开发者快速集成和测试。
MDT - MDTv2图像合成模型:更快收敛和卓越性能
GithubMasked Diffusion Transformer人工智能图像合成开源项目深度学习计算机视觉
MDTv2是一种先进的深度学习图像合成模型,在ImageNet数据集上实现了1.58的FID分数,创造新的业界标准。该模型采用掩码潜在建模技术,提高了图像语义理解能力,学习速度比先前模型快10倍以上。MDTv2在图像生成质量和训练效率方面都有显著提升,为计算机视觉和人工智能领域带来了新的可能性。
HunyuanDiT - 实现多分辨率扩散和细粒度中英文理解
GithubHunyuanDiT中英双语多轮对话开源开源项目文本生成图像
HunyuanDiT是一个多分辨率扩散变换器模型,具有细粒度的中英文理解能力。该模型采用优化的变换器结构、文本编码器和位置编码,通过迭代数据流程提升性能。HunyuanDiT支持多轮多模态对话,可根据上下文生成和优化图像。经专业评估,该模型在中文到图像生成方面达到开源模型的先进水平。
control_v1p_sd15_brightness - 提供灰度图像上色及色调重调功能
AI许可证GithubHuggingfaceStable Diffusion亮度控制图像上色开源项目模型灰度图像
该模型为Stable Diffusion提供亮度控制能力,采用ControlNet技术,能够实现灰度图像的上色及已生成图像的色调重调。
TF-ICON - 利用Text-driven Diffusion模型实现跨域图像无训练组合的框架
GithubICCV 2023TF-ICON开源项目扩散模型无训练跨域图像合成
TF-ICON是一个利用Text-driven Diffusion模型实现跨域图像无训练组合的框架。相比需要实例化优化或微调预训练模型的方法,TF-ICON无需额外训练或优化,就可无缝集成用户提供的对象,还使用了特别提示来帮助模型准确还原真实图像。实验表明,该方法在多个数据集(如CelebA-HQ、COCO和ImageNet)上的表现优于现有技术。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号