riffusion-hobby

用于实时音乐和音频生成的开源稳定扩散库

Riffusion 音乐生成音频处理稳定扩散实时生成 Github 开源项目

Riffusion是一个开源库，利用稳定扩散技术实现实时音乐和音频生成，并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用，支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端，推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护，但用户仍可参考相关资源和指南进行安装和使用。

访问官网

Github

Huggingface

介绍知识库相关项目

stable-diffusion-2-gui - Stable Diffusion v2.1的Gradio应用，支持多种图像生成和处理功能

DiffusersGithubGradioHugging FaceStability AIStable Diffusion开源项目

该页面介绍了一个适用于Stable Diffusion v2.1的Gradio应用，支持文本到图像、图像到图像、图像修复、图像放大和深度到图像等多种功能。此项目由Stability AI和Hugging Face提供支持，可在Colab平台上运行。

Diffus - 高精度Stable Diffusion图像生成平台

AI工具AI绘图Stable Diffusion人工智能艺术图像生成深度学习

Diffus为创意工作者提供精确控制的Stable Diffusion图像生成平台。用户可通过独特的构图控制、灯光和颜色调整等功能,轻松创作高质量图像。丰富的模型库支持多样化创作需求,适用于专业项目和个人创作。Diffus致力于帮助用户将创意概念转化为视觉作品,提升图像生成效率。

dreamlike-diffusion-1.0 - 经过艺术优化的Stable Diffusion图像生成模型

GithubHuggingfaceStable Diffusion人工智能绘画图像生成开源项目模型深度学习模型艺术创作

Dreamlike Diffusion 1.0通过对Stable Diffusion 1.5的艺术风格优化，提供了更强的艺术创作能力。模型支持512x768等多种分辨率配置，可生成肖像和风景作品。通过Python Diffusers、Gradio界面支持多平台使用，开放非商业用途部署，商业应用需获得授权。关键词dreamlikeart可增强作品的艺术效果。

StreamDiffusion - 高性能实时AI图像生成框架

AI绘图GithubStreamDiffusion图像处理实时生成开源项目深度学习

StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。

fish-diffusion - 开源框架简化TTS、SVS和SVC模型开发

AI模型Fish DiffusionGithub多说话人开源项目语音合成

Fish Diffusion是一个开源的语音合成训练框架，专注于TTS、SVS和SVC任务。基于扩散模型，它支持多说话人合成和44.1kHz高品质输出。该项目优化了代码结构，提高了训练效率，并提供完整的环境配置和使用指南。Fish Diffusion适合研究人员和开发者探索语音合成技术，同时强调负责任的AI应用。项目特点包括简化的代码结构、多设备训练支持和半精度训练，有助于提高开发效率和降低资源消耗。此外，还提供了详细的数据集准备和模型训练指南，便于用户快速上手。

ADI-Stable-Diffusion - 基于ONNXRuntime的Stable Diffusion推理框架

C++GithubONNXRuntimeStable Diffusion开源开源项目推理引擎

ADI-Stable-Diffusion是一个C++库和命令行工具,利用ONNXRuntime加速Stable Diffusion模型推理。该项目具有小巧的包体积和高性能,支持多种采样方法和调度器,适用于不同版本的Stable Diffusion模型。它为开发者提供了便捷的工程部署方案,可用于构建灵活的图像生成和编辑应用。

friendly-stable-audio-tools - 改进后的Stable Audio Tools开源框架支持音频生成模型训练和推理

AI音频生成GithubStable Audio开源项目模型训练深度学习音乐生成

该项目是对Stability AI的stable-audio-tools的重构和增强，提供了音频和音乐生成模型的开源代码。重构后的代码提高了可读性和易用性，并新增了评估和使用自训练模型的脚本。项目详细说明了如何训练Stable Audio 2.0等模型，并提供了Stable Audio Open 1.0的使用文档和便捷脚本。此外，项目支持多GPU/节点生成，并集成了Gradio界面用于测试模型。

automatic - 稳定扩散和其他基于扩散的生成图像模型的高级实现

GithubSD.NextStable Diffusion多平台开源项目扩展功能模型支持

该项目提供了多种后端和用户界面、高级扩展功能，支持多种扩散模型并具有跨平台兼容性。包括文本、图像和视频处理的内置控制，优化处理性能，支持最新的torch技术。具有企业级日志记录和现代化UI，兼容Windows、Linux、MacOS等系统，支持nVidia、AMD和IntelArc等硬件平台。自动更新与依赖管理功能简化了安装和更新过程，确保在多种使用场景下性能最佳。

FastDiff - 高效生成高保真语音的快速条件扩散模型

FastDiffGithubPyTorch开源项目条件扩散模型语音合成高保真语音合成

FastDiff项目实现了一种高效生成高保真语音的条件扩散模型。该项目在GitHub上提供了开源实现和预训练模型，支持包括LJSpeech、LibriTTS和VCTK在内的多种数据集。适用于语音合成和神经语音编解码等任务，并支持多GPU并行训练。项目还提供了详细的推理和训练指南，以及预处理工具和训练配置示例。FastDiff代码参考了NATSpeech和Tacotron2等项目，广泛适用于研究和实际应用。

Radiata - 基于Diffusers的全方位稳定扩散和TensorRT加速工具

ControlNetGitGithubRadiataStable DiffusionTensorRT开源项目

Radiata 是一个基于 diffusers 的稳定扩散 WebUI，提供稳定扩散、稳定扩散 XL 和 TensorRT 加速等功能。通过简单的 Git 和 Python 安装步骤，可以快速部署并享受高效的模型推理体验。同时支持 ControlNet 插件和 Lora & Lycoris 模型扩展，增强工具的灵活性和功能性。适用于 Windows 和 Linux 系统，详细文档参见官方网站。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号