#生成扩散模型

深入解析Recurrent Interface Network (RIN): 高效图像和视频生成的新型架构

2 个月前

RIN 生成扩散模型图像生成 PyTorch 自条件 Github 开源项目

2 个月前

InstructCV: 将文本到图像扩散模型转化为多任务视觉通用模型

2 个月前

InstructCV 计算机视觉文本到图像生成生成扩散模型深度学习 Github 开源项目

2 个月前

相关项目

InstructCV

InstructCV 项目通过指令调优的文本到图像扩散模型，简化了计算机视觉任务的执行方式。该项目将多个计算机视觉任务转化为文本描述的图像生成问题，并使用涵盖分割、物体检测、深度估计和分类等任务的数据集进行训练。利用大型语言模型生成任务提示，该模型从生成模型转变为指令引导的多任务视觉学习者。项目实现了多种环境配置，包括在Huggingface Spaces的Gradio演示和Google Colab的运行示例，并支持PyTorch 1.5+。

recurrent-interface-network-pytorch

Recurrent Interface Network (RIN)是一个基于PyTorch的深度学习模型，用于高效生成高质量图像和视频。该模型结合了诱导集合注意力块、潜在空间自我调节技术和新型噪声函数，无需使用级联网络即可实现出色的生成效果。RIN还支持高分辨率图像的增强噪声处理和线性gamma调度，为图像生成任务提供了灵活的解决方案。

X-Portrait 2

X-Portrait 2 采用先进的生成扩散模型，将静态肖像与驱动视频结合生成生动视频。通过精细的面部表情传递，这项技术实现了表情与动作的有效分离，能够忠实传达快速头部动作及细微表情变化，为动画和电影制作提供高质量的内容解决方案，简化了制作流程。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com