#实时生成

riffusion-hobby学习资料汇总 - 基于稳定扩散的实时音乐生成库

2 个月前

Riffusion 音乐生成音频处理稳定扩散实时生成 Github 开源项目

2 个月前

StreamDiffusion: 实时交互式生成的创新扩散管线

3 个月前

StreamDiffusion 实时生成 AI绘图图像处理深度学习 Github 开源项目

3 个月前

DiffSHEG: 基于扩散模型的实时语音驱动全身3D表情和手势生成方法

3 个月前

DiffSHEG 语音驱动生成 3D表情和手势实时生成扩散模型 Github 开源项目

3 个月前

StreamMultiDiffusion: 实现区域语义控制的实时交互式生成框架

3 个月前

StreamMultiDiffusion Stable Diffusion 3 语义控制实时生成文本到图像 Github 开源项目

3 个月前

Riffusion: 基于稳定扩散的实时音乐生成项目

3 个月前

Riffusion 音乐生成音频处理稳定扩散实时生成 Github 开源项目

3 个月前

Riffusion:基于稳定扩散的实时音乐生成库

3 个月前

Riffusion 音乐生成音频处理稳定扩散实时生成 Github 开源项目

3 个月前

Riffusion: 基于稳定扩散的实时音乐生成技术

3 个月前

Riffusion 音乐生成音频处理稳定扩散实时生成 Github 开源项目

3 个月前

相关项目

KREA

KREA平台免费提供用于生成和增强图像与视频的AI工具。该平台通过即时生成、图像优化和视频生成三大应用简化创意工作流程，并通过AI定制训练及无限画布项目扩展创作空间。

riffusion-hobby

Riffusion是一个开源库，利用稳定扩散技术实现实时音乐和音频生成，并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用，支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端，推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护，但用户仍可参考相关资源和指南进行安装和使用。

StreamMultiDiffusion

StreamMultiDiffusion 提供基于区域语义控制的实时交互式图像生成。该项目支持细粒度区域控制、分离提示和实时图像修复，能够显著降低生成延迟，适用于大尺寸图像的高效创作及全景生成等应用。

DiffSHEG

DiffSHEG是一种基于扩散模型的实时语音驱动3D表情和手势生成技术。该方法能够生成与语音同步的全息3D表情和手势，适用于不同长度的语音输入。DiffSHEG为虚拟人物动画和人机交互领域提供了新的解决方案，有助于创建更具表现力的虚拟角色。

StreamDiffusion

StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。

Oasis AI Minecraft

Oasis AI Minecraft是一个利用人工智能实时生成的全新Minecraft版本，玩家无需安装即可通过浏览器体验。每次游戏都会创建一个独特的世界，核心在于其动态演化的环境。借助前瞻帧预测技术与大量游戏录像训练模型，为玩家带来变幻莫测的探索体验。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com