dreamoving-project

基于扩散模型的人工智能视频生成框架

DreaMoving是一个基于扩散模型的视频生成框架，专注于创建高质量的定制人物视频。该系统可根据文本描述在多样化场景中生成人物动作视频，例如海滩、公园和埃及金字塔等。这个由阿里巴巴智能计算研究院开发的项目提供中英文在线演示，体现了人工智能在视频生成领域的最新技术进展。

访问官网

StoryDiffusion - 实现长序列图像和视频的一致性生成

AI生成GithubStoryDiffusion一致性自注意力开源项目长序列图像生成长视频生成

StoryDiffusion是一个专注于长序列图像和视频生成的AI项目。该项目采用一致性自注意力机制，实现角色连贯的图像生成，并通过运动预测器在压缩图像语义空间中预测条件图像间的运动。StoryDiffusion不仅能生成连贯的漫画，还可创作长时间、高质量的视频，为故事创作和视觉内容生成提供了新的技术方案。

DynamiCrafter - 将开放域图像转化为动态视频的AI动画工具

AI动画DynamiCrafterGithub图像动画化开源项目视频插帧视频生成

DynamiCrafter是一个图像动画化项目,能够基于文本提示将静态图像转换为动态视频。该项目利用预训练的视频扩散模型,生成高分辨率、连贯性强的动画。除了基础的图像动画化功能,DynamiCrafter还支持故事视频生成、帧插值和循环视频生成等应用。该项目在ECCV 2024会议上进行了口头报告,并在多项图像到视频生成基准测试中表现出色。

Human-Video-Generation - 人工智能视频生成技术的演进与应用

3D建模Github人体视频生成人工智能开源项目深度学习计算机视觉

Human-Video-Generation项目收录了2018年以来人工智能视频生成领域的重要研究成果。该项目涵盖面部重演、动作迁移和语音驱动动画等多个方向，提供了前沿论文、代码实现和演示视频。从早期的PSGAN到最新的Real3D-Portrait，项目全面展示了AI视频生成技术的快速进展，为相关领域的研究者和开发者提供了丰富的参考资源。

MotionDirector - 自定义文本到视频模型的动作生成

AI视频生成GithubMotionDirector开源项目扩散模型文本到视频运动定制

MotionDirector是一款文本到视频扩散模型定制工具,可根据视频样本学习特定动作概念并应用于视频生成。该工具支持单个或多个参考视频,能准确捕捉动作特征,实现外观和动作的同步定制。此外,MotionDirector还具备图像动画和电影镜头效果功能,为AI视频创作提供更多可能性。

stable-video-diffusion-img2vid-xt - 图像到视频转换模型Stable Video Diffusion实现动画生成

GithubHuggingfaceStable Video Diffusion人工智能图像到视频生成开源项目模型深度学习计算机视觉

Stable Video Diffusion Image-to-Video是Stability AI开发的扩散模型，可将静态图像转换为短视频。该模型生成25帧、576x1024分辨率的视频片段，视频质量优于同类产品。适用于艺术创作、教育工具等场景，支持商业和非商业用途。模型存在视频较短、不支持文本控制等局限性。开发者可通过GitHub上的开源代码使用该模型。

dreamshaper-xl-1-0 - 基于Diffusers的AI图像生成模型支持多样化创意表达

AI模型DiffusersGithubHuggingface开源项目数据集机器学习模型模型卡片

Dreamshaper-xl-1-0是基于Diffusers框架的AI图像生成模型。该模型能根据文本描述生成图像,支持多种艺术风格和场景。它可应用于创意设计、内容创作等领域。虽然功能强大,但使用时需注意潜在的偏见和局限性。目前该模型的具体训练数据、评估结果等信息尚未公开。

Make-Your-Video - 结合文本和深度信息的智能视频生成模型

AI模型GithubMake-Your-Video开源项目深度学习视频生成计算机视觉

Make-Your-Video是一个结合文本和深度信息的视频生成模型。它继承了图像潜在扩散模型的丰富视觉概念，支持长视频推理。该模型可将真实场景和3D建模场景转化为视频，并支持视频重渲染。相比其他方法，Make-Your-Video在视觉质量和动作控制方面表现优异，为视频创作提供了新的可能性。

Dreambooth-Stable-Diffusion - 使用Dreambooth-Stable-Diffusion进行个性化AI训练的指南

DreamboothGPU训练GithubJoePenna开源项目影像生成稳定扩散

Dreambooth-Stable-Diffusion项目是一个平台，支持用户在多种环境如Vast.ai、Google Colab以及本地计算机上训练AI模型。该工具适用于电影制作人、概念艺术家和设计师，用于创建和训练个性化角色和风格。项目同时提供详尽的设置指南和教程，支持多种操作环境，旨在提高工作效率和用户体验。

VideoBooth - 基于图像提示的AI视频生成新突破

GithubVideoBooth人工智能图像提示开源项目扩散模型视频生成

VideoBooth是一个AI视频生成项目，利用扩散模型技术基于图像提示创建视频。该项目将静态图像主体转化为动态视频，实现图像到视频的转换。VideoBooth采用两阶段训练方法，提供安装、推理和训练指南。项目还公开了专门数据集，为研究提供资源。

MotionLLM - 融合视频和动作数据的人类行为理解先进AI模型

GithubMotionLLM人工智能人类行为理解多模态学习大语言模型开源项目

MotionLLM是一个人类行为理解框架，通过融合视频和动作序列数据来分析人类行为。该项目采用统一的视频-动作训练策略，结合粗粒度视频-文本和细粒度动作-文本数据，以获得深入的时空洞察。项目还包括MoVid数据集和MoVid-Bench评估工具，用于研究和评估人类行为理解。MotionLLM在行为描述、时空理解和推理方面展现出优越性能，为人机交互和行为分析研究提供了新的方向。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com