#AI视频生成
Open-Sora-Plan学习资料汇总 - 开源复现Sora的文本到视频生成模型
AnimateDiff: 为Stable Diffusion WebUI带来动态视频生成能力
Luma AI
Luma AI专注于3D AI技术,通过Dream Machine模型,仅需文本和图像即可快速制作高质量视频,适合各类用户。
Open-Sora-Plan
Open-Sora-Plan 是由北大-兔展AIGC联合实验室发起的开源项目,旨在复刻并优化Sora模型,采用华为昇腾AI计算系统进行训练和推理。该项目通过3D全注意力架构,提升视频质量与处理速度,还支持视频压缩和文本到视频的生成。项目包含丰富的资源和版本,持续更新,欢迎社区贡献和Pull request。
即梦Dreamina
即梦AI,一站式智能创作平台,提供AI绘画及视频生成服务。平台允许通过文字或图片输入,快速创造高质量视频和图像,支持多种艺术风格和详细控制,以促进创意实现和社区间的灵感交流。立即体验智能创作,解锁艺术与创意的无限潜能。
Stable Video
Stable Video运用AI技术提供专业视频制作和图像编辑工具,将文本或图像转化为高质量视频,支持免费试用。
Viva AI
Viva AI提供多种AI生成功能,如文本到图片、图片到图片、文本到视频、图片到视频等,配备先进的编辑工具,支持图像放大、重绘及升级至4K分辨率。该平台简便易用,帮助用户高效创作优质视觉内容。
Whisper-TikTok
Whisper-TikTok是一个开源项目,集成了Edge TTS、OpenAI-Whisper和FFMPEG技术,用于自动生成TikTok视频。该工具可以从音频文件生成转录,使用Microsoft Edge Cloud TTS API添加配音,并支持自定义背景视频和字幕样式。项目提供Web应用和命令行界面,方便用户创建TikTok内容。Whisper-TikTok为内容创作者提供了自动化视频生成的解决方案。
ComfyUI-AnimateAnyone-Evolved
ComfyUI-AnimateAnyone-Evolved是AnimateAnyone的改进实现,利用姿态图像序列和参考图像生成风格化视频。项目支持DDIM、DPM++等多种采样器和调度器,能处理长序列姿态图像。目标是在RTX 3080及以上GPU上实现每秒1帧以上的姿态到视频生成速度,并通过优化提升性能和质量。
FIFO-Diffusion_public
FIFO-Diffusion是一种创新的文本到视频生成技术,无需额外训练即可从文本描述生成无限长度的高质量视频。该项目具有低内存需求(不到10GB VRAM)、支持多GPU并行推理等特点,并可与VideoCrafter2和Open-Sora Plan等先进模型兼容。FIFO-Diffusion为研究人员和开发者提供了探索和创造长时间、连贯视频内容的有力工具。
KREA
KREA平台免费提供用于生成和增强图像与视频的AI工具。该平台通过即时生成、图像优化和视频生成三大应用简化创意工作流程,并通过AI定制训练及无限画布项目扩展创作空间。