Logo

#实时生成

riffusion-hobby学习资料汇总 - 基于稳定扩散的实时音乐生成库

1 个月前
Cover of riffusion-hobby学习资料汇总 - 基于稳定扩散的实时音乐生成库

DiffSHEG: 基于扩散模型的实时语音驱动全身3D表情和手势生成方法

2 个月前
Cover of DiffSHEG: 基于扩散模型的实时语音驱动全身3D表情和手势生成方法

Riffusion: 基于稳定扩散的实时音乐生成项目

2 个月前
Cover of Riffusion: 基于稳定扩散的实时音乐生成项目

Riffusion: 基于稳定扩散的实时音乐生成技术

2 个月前
Cover of Riffusion: 基于稳定扩散的实时音乐生成技术

StreamDiffusion: 实时交互式生成的创新扩散管线

2 个月前
Cover of StreamDiffusion: 实时交互式生成的创新扩散管线

StreamMultiDiffusion: 实现区域语义控制的实时交互式生成框架

2 个月前
Cover of StreamMultiDiffusion: 实现区域语义控制的实时交互式生成框架

Riffusion:基于稳定扩散的实时音乐生成库

2 个月前
Cover of Riffusion:基于稳定扩散的实时音乐生成库

相关项目

Project Cover
KREA
KREA平台免费提供用于生成和增强图像与视频的AI工具。该平台通过即时生成、图像优化和视频生成三大应用简化创意工作流程,并通过AI定制训练及无限画布项目扩展创作空间。
Project Cover
riffusion-hobby
Riffusion是一个开源库,利用稳定扩散技术实现实时音乐和音频生成,并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用,支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端,推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护,但用户仍可参考相关资源和指南进行安装和使用。
Project Cover
StreamMultiDiffusion
StreamMultiDiffusion 提供基于区域语义控制的实时交互式图像生成。该项目支持细粒度区域控制、分离提示和实时图像修复,能够显著降低生成延迟,适用于大尺寸图像的高效创作及全景生成等应用。
Project Cover
DiffSHEG
DiffSHEG是一种基于扩散模型的实时语音驱动3D表情和手势生成技术。该方法能够生成与语音同步的全息3D表情和手势,适用于不同长度的语音输入。DiffSHEG为虚拟人物动画和人机交互领域提供了新的解决方案,有助于创建更具表现力的虚拟角色。
Project Cover
StreamDiffusion
StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号