dreamoving-project

基于扩散模型的人工智能视频生成框架

DreaMoving是一个基于扩散模型的视频生成框架，专注于创建高质量的定制人物视频。该系统可根据文本描述在多样化场景中生成人物动作视频，例如海滩、公园和埃及金字塔等。这个由阿里巴巴智能计算研究院开发的项目提供中英文在线演示，体现了人工智能在视频生成领域的最新技术进展。

访问官网

Story Diffusion Gen - AI连贯角色与故事生成平台

AI工具AI绘图Story Diffusion文本生成图像漫画创作视频生成

Story Diffusion Gen是一款基于AI的内容创作平台，能够将文本转化为连贯的图像和视频序列。通过先进的自注意力机制，该平台确保角色和场景在整个叙事过程中保持一致性。它支持创作者生成故事、漫画和视频，界面友好，适合不同经验水平的用户。平台的动作预测功能还能从图像序列创建动态视频，为数字叙事和内容创作提供了新的可能性。

MindVideo - 大脑活动视频重建技术取得重大突破

GithubMinD-VideofMRI开源项目神经科学脑活动视频重建

MinD-Video是一种从大脑记录重建高质量视频的新型框架。该技术利用掩蔽大脑建模、多模态对比学习和增强稳定扩散模型，从fMRI数据中学习时空信息。MinD-Video可重建任意帧率的视频，在语义分类任务中准确率达85%，结构相似性指数达0.19，较先前技术提升45%。这项研究在NeurIPS 2023获得口头报告资格，为理解人类认知过程提供了新的途径。

DiffSynth-Studio - 多功能扩散模型引擎支持长视频合成与图像生成

AI绘画DiffSynth StudioGithub图像合成开源项目扩散模型视频生成

DiffSynth Studio是一款开源的扩散模型引擎，整合了ExVideo、Stable Diffusion 3和Kolors等多种AI模型。该引擎支持长视频合成、高分辨率图像生成、卡通渲染和视频风格化等功能。项目持续更新，重点探索扩散模型在视频合成领域的应用潜力。

imaginAIry - 探索图像和视频的稳定扩散与AI生成

AI绘图GithubImaginAIry图像处理开源项目热门稳定扩散视频视频生成

imaginAIry是一个先进的AI工具，支持生成高稳定性的图像和视频。项目适用于Linux和macOS操作系统，支持Nvidia GPUs，可通过Python轻松集成。它集成了最新的视频帧插值技术和多种控制模式，如深度图、正常图和控制网图等。此外，imaginAIry还引入了视频输出支持多种格式，如MP4、WebP和GIF，用户可按需生成高质量媒体内容。

Luma AI Video Generator - AI视频生成工具，实时将文本和图像转换为高质量内容

AI工具Cloudflare在线攻击防护封锁访问网站安全触发安全措施

Luma AI Video Generator是一款由Dream Machine驱动的AI视频生成工具，可将文本描述和图像实时转换为高质量视频内容。该平台提供逼真的视觉效果和直观的界面，适用于多种场景，包括营销视频、教育内容和创意项目。Luma AI旨在提高视频创作效率，为专业人士和创意工作者提供便捷的视频制作解决方案。

DigiHuman - 基于摄像头输入的3D角色全身动画生成系统

3D动画生成DigiHumanGithubUnity3D姿态估计开源项目面部动画

DigiHuman是一个开源的人工智能项目，通过摄像头输入自动生成3D角色模型的全身和面部动画。系统结合MediaPipe生成3D关键点和Unity3D渲染技术，实现了全身动作、面部表情等多种动画效果。支持多个混合形状动画、视频导出等功能，为3D虚拟角色动画制作提供了自动化解决方案。该项目支持多种3D模型类型，并优化了动画平滑度，为动画创作者和研究人员提供了创新工具和无限可能。

Open-AnimateAnyone - 人人皆可使用的AI动画生成项目

AI绘图Animate AnyoneGithub人工智能开源项目深度学习计算机视觉

Open-AnimateAnyone是一个非官方实现的AI动画生成项目，基于magic-animate和AnimateDiff构建。项目提供训练和推理代码，以及Gradio演示界面。在小规模数据集上进行训练，展示了有限数据条件下的动画生成能力。开发者分享了有价值的训练经验，为未来改进提供方向。尽管存在一些限制，该项目仍为AI动画生成技术的开放研究做出了贡献。

DreamShaper - 多功能AI艺术创作模型适用于多种平台

Dream ShaperGithubHugging FaceHuggingfaceStable Diffusion人工智能艺术开源项目文生图模型

DreamShaper是一个开源的文本到图像AI模型，专注于生成高质量艺术作品和动漫风格图像。该模型可在Hugging Face、Mage.space和sinkin.ai等多个平台上运行。DreamShaper由Lykon开发，持续更新中。有兴趣的用户可以通过Patreon或其他方式支持项目发展。

AingDiffusion9.2 - 通过文本生成高清晰度图像

AI绘图GithubHugging FaceHuggingfacestable-diffusion图像生成开源项目模型高质量图像

该项目利用稳定扩散原理和先进的扩散器技术，以生成超逼真的高细节图像。产生图像具备锐利的焦点和鲜艳的色彩，从而流畅映射文本描述。探索AI与视觉创意的交汇，体验创新与实践在生成3D电影级图像中的应用。

GaussianDreamer - 通过桥接 2D 和 3D 扩散模型从文本快速生成到 3D 高斯

2D扩散模型3D扩散模型3D生成CVPR 2024GaussianDreamerGithub开源项目

本文客观介绍了通过整合2D和3D扩散模型的快速3D对象生成框架GaussianDreamer。3D扩散模型提供初始几何信息，而2D扩散模型则增强了其几何和外观。GaussianDreamer在单个GPU上可在15分钟内生成高质量的3D实例，比现有方法更快。生成的3D实例支持实时渲染，可方便地整合到动画和仿真管道中。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com