#VideoCrafter
sd-webui-text2video - 基于Auto1111的多样化text2video模型实现
StableDiffusion WebUIModelScopeVideoCrafterLoRAText2videoGithub开源项目
基于Auto1111的webui依赖,该扩展实现了ModelScope和VideoCrafter等text2video模型,无需登录即可使用。要求至少6GB的VRAM,支持不同帧数和分辨率的视频生成。项目包含多次更新,新增功能如VAE设置、提示权重和WebAPI,并支持LoRA训练。提供详细的模型下载指南,并欢迎社区的贡献与支持。
cond-image-leakage - 改进图像到视频扩散模型中的条件图像依赖问题
图像到视频生成扩散模型条件图像泄漏DynamiCrafterVideoCrafterGithub开源项目
该研究揭示并解决了图像到视频扩散模型中的条件图像依赖问题。研究团队提出了适用于DynamiCrafter、SVD和VideoCrafter1等多种模型的即插即用推理和训练策略。这些策略减轻了模型对条件图像的过度依赖,增强了生成视频的动态效果。项目开源的代码、模型和演示为图像到视频生成研究提供了重要参考。