Project Icon

DiffusionKit

为Apple Silicon优化的扩散模型推理框架

DiffusionKit是一个针对Apple Silicon芯片优化的扩散模型工具包。该项目包含用于将PyTorch模型转换为Core ML格式的Python组件,以及用于设备端推理的Swift组件。通过集成MLX,DiffusionKit实现了高效的图像生成,并为Stable Diffusion 3和FLUX等模型提供了简洁的命令行和API接口。这一工具为在苹果设备上进行AI图像生成研究和应用开发提供了实用解决方案。

distrifuser - 高效分布式并行推理助力高分辨率图像生成
DistriFusionGPU加速Githubdiffusion模型并行推理开源项目高分辨率
DistriFusion是一种用于高分辨率扩散模型的分布式并行推理算法。该方法无需额外训练,通过多GPU协同工作加速推理过程,同时保持图像质量。其创新的补丁交互技术解决了传统方法的碎片化问题,在高分辨率图像生成任务中显著提升了性能。该项目已在CVPR 2024被评为亮点工作,并开源了相关代码。
CrystalClearXL - 基于扩散模型的AI图像生成与编辑工具
DiffusersGithubHuggingface人工智能开源项目数据集机器学习模型模型卡片
CrystalClearXL是一个基于扩散模型的AI图像处理工具,由Hugging Face的Diffusers库支持。该工具可用于多种图像生成和编辑任务,具有灵活性强、易用性高的特点。适用于直接应用和下游任务开发,但用户需注意其潜在局限性。CrystalClearXL为AI图像生成领域的研究和开发提供了新的可能性。
Swift-AI - 使用Swift编写的深度学习库,专为苹果平台优化
GithubSwift AI开源项目手写识别深度学习神经网络苹果平台
Swift AI是一个全面使用Swift编写的深度学习库,适用于所有苹果平台,且即将拓展到Linux平台。该库涵盖了适用于人工智能和科学研究的多种工具集,例如专门针对苹果硬件进行优化的全连接神经网络。通过项目示例,您能够直观了解如何有效利用这些工具。
stable-diffusion-deploy - 开源项目助力AI艺术生成模型的部署与扩展
AI绘图GithubLightning AppsMuseStable Diffusion开源项目生产环境部署
项目利用Lightning Apps框架,演示了稳定扩散模型在实际生产环境中的部署流程。核心功能涵盖负载均衡、GPU推理加速、性能评估及微服务协调。通过整合多租户架构、React.js界面、动态GPU处理和弹性扩展等技术,该项目为AI艺术创作领域提供了一套完整的开源解决方案。
stable-diffusion-xl-base-1.0 - 先进的AI文本转图像生成模型,实现高质量图像创作
AI绘图GithubHuggingfaceSDXLStable Diffusion开源项目扩散模型文本生成图像模型
Stable Diffusion XL 1.0基础模型是一款开源的AI文本转图像工具,采用潜在扩散技术,能根据文字描述生成高质量图像。该模型性能显著提升,适用于艺术创作、教育和研究等领域。它支持多种框架,为开发者提供灵活的应用选择。作为开源项目,它展现了AI图像生成的最新进展,不仅能创建高质量图像,还支持图像修改功能。
ThinkDiffusion - 云端Stable Diffusion工作空间提供全面AI艺术创作环境
AI工具AI绘图GPU渲染Stable Diffusion云端工作空间开源应用
ThinkDiffusion提供云端Stable Diffusion工作空间,包含预装Automatic1111、ComfyUI和Kohya等开源应用的私有高性能实例。平台支持自由添加扩展、上传模型,无需复杂配置即可开始创作。从入门到专业的多种界面选择,满足不同层次用户需求,简化AI艺术创作流程。
Awesome-diffusion-model-for-image-processing - 扩散模型在图像处理领域的最新进展与应用汇总
Github图像处理图像复原开源项目扩散模型深度学习超分辨率
本项目汇总了扩散模型在图像处理领域的最新研究进展,涵盖图像复原、增强、编码和质量评估等方面。重点关注图像超分辨率、修复和去噪等任务,提供全面的调查报告和定期更新的研究成果。项目收录了大量相关开源代码和数据集资源,为研究人员提供了重要的参考信息。
stable-diffusion-3-medium - 基于多模态扩散变换器的开源AI图像生成模型
GithubHuggingfaceStable Diffusion 3人工智能绘画图像生成模型开源项目文本生成图像模型非商业许可
Stable Diffusion 3 Medium是Stability AI开发的文本生成图像模型,采用多模态扩散变换器(MMDiT)架构,集成OpenCLIP、CLIP和T5三种文本编码器。模型通过10亿图像预训练和3000万张图像微调,支持图像生成、字体排版等功能。提供多种模型变体,可通过ComfyUI或API使用,仅限非商业研究用途。
PAIR-Diffusion - 多模态对象级图像编辑的开源解决方案
GithubPAIR Diffusion图像编辑多模态对象级别开源项目扩散模型
PAIR-Diffusion是一个开源的多模态对象级图像编辑器。它支持外观编辑、形状修改、对象添加和变体生成等功能,可通过参考图像和文本进行控制。该项目基于PyTorch开发,兼容各种扩散模型。PAIR-Diffusion在SDv1.5上实现,并使用COCO-Stuff数据集微调。这个工具为对象级图像编辑提供了灵活精确的解决方案。
ponyDiffusion-V6-XL-Turbo-DPO - 基于Diffusers的高效文本生成图像模型
AI绘图GithubHuggingfacePony DiffusionSafetensorsText-to-Image开源项目模型深度学习模型
Pony Diffusion V6 XL Turbo DPO的Diffusers版本保留了原模型的文本到图像生成能力。该版本采用Diffusers框架,提高了处理效率和兼容性。模型支持Safetensors格式,适用于创建多样化的图像内容。这一开源项目为艺术创作和设计应用提供了有力工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号