#实时生成
StreamMultiDiffusion: 实现区域语义控制的实时交互式生成框架
KREA
KREA平台免费提供用于生成和增强图像与视频的AI工具。该平台通过即时生成、图像优化和视频生成三大应用简化创意工作流程,并通过AI定制训练及无限画布项目扩展创作空间。
riffusion-hobby
Riffusion是一个开源库,利用稳定扩散技术实现实时音乐和音频生成,并在图像和音频之间进行转换。该库提供扩散管道、命令行工具和互动应用,支持通过Flask服务器进行模型推理。支持CPU、CUDA和MPS后端,推荐使用CUDA支持的GPU以获得最佳性能。虽然项目已停止维护,但用户仍可参考相关资源和指南进行安装和使用。
StreamMultiDiffusion
StreamMultiDiffusion 提供基于区域语义控制的实时交互式图像生成。该项目支持细粒度区域控制、分离提示和实时图像修复,能够显著降低生成延迟,适用于大尺寸图像的高效创作及全景生成等应用。
DiffSHEG
DiffSHEG是一种基于扩散模型的实时语音驱动3D表情和手势生成技术。该方法能够生成与语音同步的全息3D表情和手势,适用于不同长度的语音输入。DiffSHEG为虚拟人物动画和人机交互领域提供了新的解决方案,有助于创建更具表现力的虚拟角色。
StreamDiffusion
StreamDiffusion是一个开源的高性能AI图像生成框架,专为实时交互应用设计。它采用流批处理、残差无分类引导等创新技术,大幅提升了扩散模型的生成速度。在RTX 4090显卡上,使用SD-turbo模型可实现每秒106帧的文生图速度,LCM-LoRA与KohakuV2模型组合也能达到每秒38帧。该项目为开发实时AI图像生成应用提供了有力支持。
Oasis AI Minecraft
Oasis AI Minecraft是一个利用人工智能实时生成的全新Minecraft版本,玩家无需安装即可通过浏览器体验。每次游戏都会创建一个独特的世界,核心在于其动态演化的环境。借助前瞻帧预测技术与大量游戏录像训练模型,为玩家带来变幻莫测的探索体验。