sd-parseq

优化Stable Diffusion动画生成的参数调节工具，支持音频同步

Parseq Stable Diffusion Deforum 参数序列器 Automatic1111 Github 开源项目

Parseq是一个为Deforum扩展设计的参数序列器，允许用户通过脚本化的插值方式控制Stable Diffusion的参数，从而生成动画并实现音频同步。Parseq支持复杂的表达式语言，能够处理变焦、平移及3D旋转等输入参数，并提供前端存储和本地处理的便利。它与Automatic1111的Stable Diffusion界面集成简便，显著简化动画制作流程，并支持模块化管理和分享工作。

访问官网

Github

介绍相关项目

LayerDiffuse - 基于潜在透明度的图层扩散技术突破图像处理新境界

AI绘图GithubLayerDiffuse图像处理开源项目潜在透明度透明图层扩散

LayerDiffuse是一个开源图像处理项目，专注于利用潜在透明度实现透明图层扩散。目前支持Stable Diffusion WebUI和Diffusers CLI平台，未来将扩展到Gradio、Colab和Huggingface Space。项目计划发布数据集和训练代码，为图像处理领域提供新的技术方案。通过创新的图层处理工具，LayerDiffuse开启了图像创作的无限可能。

PAIR-Diffusion - 多模态对象级图像编辑的开源解决方案

GithubPAIR Diffusion图像编辑多模态对象级别开源项目扩散模型

PAIR-Diffusion是一个开源的多模态对象级图像编辑器。它支持外观编辑、形状修改、对象添加和变体生成等功能，可通过参考图像和文本进行控制。该项目基于PyTorch开发，兼容各种扩散模型。PAIR-Diffusion在SDv1.5上实现，并使用COCO-Stuff数据集微调。这个工具为对象级图像编辑提供了灵活精确的解决方案。

DragDiffusion - 基于扩散模型的交互式图像编辑工具

DragDiffusionGithub交互式人工智能图像编辑开源项目扩散模型

DragDiffusion结合扩散模型和交互式编辑，允许用户通过拖拽操作修改图像。支持真实和生成图像编辑，集成LoRA训练、自定义VAE和FreeU技术，提高编辑质量和效率。这个研究项目为图像处理提供了新的方法和工具。

stable-diffusion.cpp - 纯C/C++实现的Stable Diffusion推理，支持多种模型和内存优化

Control NetESRGANGithubPhotoMakerggmlstable-diffusion.cpp开源项目

该项目基于ggml实现了轻量级纯C/C++的Stable Diffusion推理，支持SD1.x至SD3的多种模型，包括SD-Turbo和PhotoMaker。项目特色有16位和32位浮点支持、4至8位整数量化、CPU和GPU加速、Flash Attention内存优化及多平台兼容。用户可以下载可执行文件或选择手动构建，并且无需转换为.ggml或.gguf格式。

Mosaic - 开源实时音视频创作工具

GithubMosaic创意编码开源软件开源项目视觉编程跨平台

Mosaic是一款开源跨平台的实时音视频创作工具，面向艺术家和创意编码者。它采用可视化编程界面，整合Lua、GLSL实时编码和Pure Data等多种创意工具。Mosaic具备多线程处理、插件扩展、内置代码编辑器和非线性时间轴等特性，为创作提供灵活强大的支持。该工具适用于现场表演、教学和生成式艺术装置等领域，旨在提升人机交互效率和创意开发速度。

stable-video-diffusion.com - Stable Video Diffusion，创新的图像转视频技术

AI工具AI视频生成Stable Video Diffusion图像转视频开源模型生成式AI

stable-video-diffusion.com介绍了Stable Video Diffusion技术，这是一种新型的图像到视频转换方法。网站详细说明了SVD和SVD-XT两种模型的特点和应用，包括它们的分辨率、帧数和帧率。作为研究预览版本，该技术主要用于教育和创意领域。网站还讨论了这项技术在广告、教育和娱乐行业的潜在应用，以及当前的技术限制。作为开源项目，网站鼓励开发者参与，推动视频生成技术的进步。

qi - 基于中文的高效开源编程语言

GithubQi中文编程语言开源开源项目快速轻量级

Qi是一款基于中文语法的编程语言，设计目标是提高中文使用者的编程学习效率。它采用单次编译器生成高效字节码，运行性能可与主流动态语言相当。Qi的代码库仅5000行左右，可执行文件约140KB，兼具轻量和功能性。作为开源项目，Qi为中文编程领域带来了新的选择。它支持面向对象编程，使用易于理解的中文关键字，为中文开发者提供了更直观的编程体验。

sd-webui-discord - Go语言开发的Stable Diffusion WebUI多节点Discord机器人

AI绘图Discord机器人GithubSD-WEBUI-DISCORD开源项目稳定扩散集群部署

sd-webui-discord是一个基于Go语言开发的Discord机器人，为Stable Diffusion WebUI提供多节点集群支持。该项目实现了自动任务调度，支持文本生成图像、图像编辑、人脸替换等功能。此外，它还包含用户中心、多语言支持和网站界面，为AI图像生成提供了全面的解决方案。该项目集成了ControlNet、SDXL等先进技术，支持图像分割、背景移除和超分辨率处理。它采用分布式架构，可实现多个Stable Diffusion WebUI节点的负载均衡。项目还提供了用户管理、多语言支持和网页界面，方便用户和管理员操作。

Airparser - 智能文档数据提取和自动化处理平台

AI工具AirparserGPT解析器数据提取文档处理自动化

Airparser是一款基于GPT技术的智能数据提取平台，能从邮件、PDF和各类文档中自动提取结构化数据。支持多种文档格式，包括手写文本，设置简便快速。集成OCR引擎，提供API和webhook，支持60多种语言识别。可将提取数据实时导出至Google Sheets、HubSpot、QuickBooks等多种应用和平台。Airparser为企业提供高效、安全的数据处理方案，简化文档管理和数据分析流程。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号