#实时生成

riffusion-hobby学习资料汇总 - 基于稳定扩散的实时音乐生成库

2 个月前
Cover of riffusion-hobby学习资料汇总 - 基于稳定扩散的实时音乐生成库

StreamDiffusion: 实时交互式生成的创新扩散管线

3 个月前
Cover of StreamDiffusion: 实时交互式生成的创新扩散管线

DiffSHEG: 基于扩散模型的实时语音驱动全身3D表情和手势生成方法

3 个月前
Cover of DiffSHEG: 基于扩散模型的实时语音驱动全身3D表情和手势生成方法

StreamMultiDiffusion: 实现区域语义控制的实时交互式生成框架

3 个月前
Cover of StreamMultiDiffusion: 实现区域语义控制的实时交互式生成框架

Riffusion: 基于稳定扩散的实时音乐生成项目

3 个月前
Cover of Riffusion: 基于稳定扩散的实时音乐生成项目

Riffusion:基于稳定扩散的实时音乐生成库

3 个月前
Cover of Riffusion:基于稳定扩散的实时音乐生成库

Riffusion: 基于稳定扩散的实时音乐生成技术

3 个月前
Cover of Riffusion: 基于稳定扩散的实时音乐生成技术
相关项目
Project Cover

KREA

KREA平台免费提供用于生成和增强图像与视频的AI工具。该平台通过即时生成、图像优化和视频生成三大应用简化创意工作流程,并通过AI定制训练及无限画布项目扩展创作空间。

Project Cover

riffusion-hobby

Riffusion是一个开源库,利用稳定扩散技术实现实时音乐和音频生成,并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用,支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端,推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护,但用户仍可参考相关资源和指南进行安装和使用。

Project Cover

StreamMultiDiffusion

StreamMultiDiffusion 提供基于区域语义控制的实时交互式图像生成。该项目支持细粒度区域控制、分离提示和实时图像修复,能够显著降低生成延迟,适用于大尺寸图像的高效创作及全景生成等应用。

Project Cover

DiffSHEG

DiffSHEG是一种基于扩散模型的实时语音驱动3D表情和手势生成技术。该方法能够生成与语音同步的全息3D表情和手势,适用于不同长度的语音输入。DiffSHEG为虚拟人物动画和人机交互领域提供了新的解决方案,有助于创建更具表现力的虚拟角色。

Project Cover

StreamDiffusion

StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。

Project Cover

Oasis AI Minecraft

Oasis AI Minecraft是一个利用人工智能实时生成的全新Minecraft版本,玩家无需安装即可通过浏览器体验。每次游戏都会创建一个独特的世界,核心在于其动态演化的环境。借助前瞻帧预测技术与大量游戏录像训练模型,为玩家带来变幻莫测的探索体验。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号