#文本生成视频

SoraFlows - 跨平台文本和图片转视频工具

SoraFlowsOpenAI文本生成视频跨平台部署应用Github开源项目

SoraFlows提供浏览器界面，便捷生成和编辑文本与图片转视频内容，并支持多种部署方式。该工具包含Prompt编辑器、语音转文本、文本转语音和语音克隆等功能，支持多种登录和支付方式，适用于跨平台应用的免费部署。

Awesome-Open-AI-Sora - 文本转视频技术模型

Open AI SoraAI生成视频文本生成视频AI模型视频生成Github开源项目

Sora是由OpenAI推出的AI模型，能根据文本指令生成生动的场景，视频时长可达60秒，包括详细场景、相机运动和多角色演绎。Sora还可应用于虚拟现实和电影制作等领域。尽管Sora项目尚处于早期阶段，其资源列表会定期更新，涵盖GitHub项目、文章、博客、在线课程、书籍、研究论文和视频等多方面内容，提供全面的信息和学习路径。

FollowYourPose - 基于姿态和文本的自动视频生成技术

Follow-Your-Pose文本生成视频姿态控制AI生成AAAI 2024Github开源项目

FollowYourPose项目提出了一种新方法，可以通过姿态和文本生成视频。该方法采用两阶段训练方案，利用易获取的数据集和预训练的文本到图像模型，生成可编辑且姿态可控的角色视频。第一阶段通过关键点图像对进行文本到图像的生成，第二阶段利用姿态自由视频数据集微调网络，成功生成连续的姿态可控角色视频，同时保留预训练模型的编辑和概念组合能力。

LaVie - 级联潜在扩散模型实现高质量视频生成

LaVie视频生成潜在扩散模型文本生成视频AI视频制作Github开源项目

LaVie是一个基于级联潜在扩散模型的文本到视频生成框架。它通过基础模型生成、视频插值和超分辨率三个步骤,可生成16至61帧、最高1280x2048分辨率的高质量视频。该框架支持多种采样方法和参数调整,用户可通过简单命令生成不同风格视频。LaVie开源了模型代码和预训练权重,便于学术研究和商业应用。

FIFO-Diffusion_public - 文本驱动的无限长度视频生成技术

FIFO-DiffusionAI视频生成文本生成视频无限长视频开源项目Github

FIFO-Diffusion是一种创新的文本到视频生成技术，无需额外训练即可从文本描述生成无限长度的高质量视频。该项目具有低内存需求（不到10GB VRAM）、支持多GPU并行推理等特点，并可与VideoCrafter2和Open-Sora Plan等先进模型兼容。FIFO-Diffusion为研究人员和开发者提供了探索和创造长时间、连贯视频内容的有力工具。

Tune-A-Video - 图像扩散模型微调实现高质量文本到视频转换

Tune-A-Video文本生成视频扩散模型人工智能计算机视觉Github开源项目

Tune-A-Video项目通过微调预训练的文本到图像扩散模型，实现高质量文本到视频生成。该方法仅需一个视频-文本对作为输入，即可快速适应新的视频生成任务。支持Stable Diffusion等多种预训练模型，能生成多样化风格的视频内容。项目开源代码实现，提供在线演示和预训练模型，为研究和开发提供便捷的文本到视频生成工具。

Sora Videos - OpenAI Sora AI文本生成视频技术展示与对比分析

AI工具Sora AI文本生成视频OpenAIAI视频技术视频生成模型

Sora Videos汇集了OpenAI最新文本生成视频技术Sora AI的展示内容。网站提供Sora AI生成视频的浏览功能，呈现了这项创新技术在视频创作领域的能力。涵盖Sora AI的核心特性，包括逼真场景创建、复杂场景生成和深度语言理解等，同时对比了其他视频生成模型。通过精选视频，直观展示Sora AI对视频制作未来的影响。

ChatGpt Sora - 基于Sora模型的开源平台实现文本到视频转换

AI工具ChatGpt SoraOpenAI文本生成视频AI视频创作Sora模型

ChatGpt Sora是一个基于OpenAI Sora模型的开源平台，实现文本到视频的转换。平台提供直观的界面，用户只需输入文本即可生成高质量视频。适用于专业人士和爱好者，简化视频制作流程。虽然Sora模型尚未公开，ChatGpt Sora通过模拟API为开发者提供测试环境。该平台展示了AI在视频生成领域的应用潜力，为创作者提供了探索OpenAI Sora技术的机会。

KandinskyVideo - 先进的开源文本到视频生成模型

Kandinsky Video 1.1文本生成视频人工智能开源模型视频生成技术Github开源项目

KandinskyVideo 1.1是一个开源的文本到视频生成模型，在EvalCrafter基准测试中表现突出。该模型采用三阶段生成流程：初始帧生成、关键帧生成和帧插值，有效提高了视频质量和内容连贯性。除了支持文本到视频转换，KandinskyVideo 1.1还能为输入图像添加动画效果。在视觉质量、文本-视频对齐、动作质量和时间连贯性等方面，该模型都展现出优秀性能，体现了开源文本到视频生成技术的最新发展。

text-to-video-synthesis-colab - 多模型文本到视频合成工具集成

文本生成视频ColabAI模型Hugging Face开源项目Github

该开源项目集成了Longscope、Zeroscope和Potat1等多个文本到视频合成模型。用户可在Colab环境中,通过输入文本生成短视频。项目支持多种分辨率和风格选择,并包含视频增强功能。这一工具集适用于多种创意和内容制作场景,为AI视频创作提供了便利。

zeroscope_v2_576w - 基于Modelscope的16:9视频生成模型

视频合成开源项目模型AI模型Github视频分辨率Huggingface文本生成视频ModelScope

zeroscope_v2_576w是基于Modelscope开发的视频生成模型，支持生成576x320分辨率、24帧的16:9视频。模型通过9,923个视频片段和29,769个标记帧训练而成，可与zeroscope_v2_XL模型配合使用vid2vid技术进行视频放大。在渲染30帧576x320视频时占用显存7.9GB。

相关文章

Article Cover

OpenAI Sora: 人工智能视频生成的新纪元

Article Cover

FollowYourPose: 基于无姿势视频的姿势引导文本到视频生成

Article Cover

LaVie: 高质量视频生成的级联潜在扩散模型

Article Cover

FIFO-Diffusion: 无需训练生成无限长文本到视频

Article Cover

Tune-A-Video: 一种创新的一镜到底文本到视频生成技术

Article Cover

Kandinsky Video 1.1: 突破性的文本到视频生成模型

Article Cover

Text-to-Video Synthesis Colab: 将文字转化为视频的创新工具

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号