phenaki-pytorch

PyTorch实现Phenaki长视频AI生成技术

Phenaki 视频生成 AI 机器学习 Pytorch Github 开源项目

项目采用PyTorch框架,实现Phenaki视频生成技术。通过Mask GIT方法,能根据文本提示生成最长2分钟的视频。引入token critic技术以提升生成质量。提供简洁API,支持条件和无条件生成模式。包含完整训练与推理代码,适用于文本到图像和视频生成的相关研究。

PortraitGen-code - 肖像视频编辑技术，结合多模态生成模型

3D重建GithubPortraitGen多模态生成开源项目视频编辑风格迁移

这个项目实现了一种创新的肖像视频编辑方法，采用多模态生成模型来实现统一且高表达力的风格转换，能够处理单目RGB视频中的文本和图像驱动的高质量编辑以及光照调整，从而提高面部结构呈现的质量。

Gen-L-Video - 无需额外训练实现多文本条件长视频生成和编辑

Gen-L-VideoGithub多文本条件开源项目无需预训练视频编辑长视频生成

Gen-L-Video是一种扩展短视频扩散模型的视频生成方法,能实现多文本条件下的长视频生成和编辑。该方法无需额外训练即可处理数百帧的视频,并保持内容一致性。Gen-L-Video支持多语义段视频生成、平滑语义变化和视频内容编辑等功能,为长视频处理提供了一种通用解决方案。

text2cinemagraph - 文本描述生成电影图像的全自动方法

GithubODISEOptical Flow PredictionPyTorchStable DiffusionText2Cinemagraph开源项目

该项目提供了一种由文本描述生成映画图的全自动方法。通过Stable Diffusion技术，从自然图像和视频数据集中提取语义信息，预测并传递运动到艺术风格图像中，生成电影图像。详细说明了环境设置、预训练模型下载及推理和训练指南，适用于高级图像处理和动画生成的用户。

MimicMotion - 基于AI的高质量人体动作视频生成框架

AIGithubMimicMotion人体动作开源项目深度学习视频生成

MimicMotion是一个创新的视频生成框架，可基于任意动作指导生成高质量的长视频。该项目采用置信度感知的姿态引导技术，提高了时间平滑性和模型鲁棒性。通过区域损失放大和渐进式潜在融合策略，MimicMotion有效解决了图像失真问题，并能以较低的资源消耗生成长视频。这一技术在视频质量、控制性和生成长度等方面显著优于现有方法，为人体运动视频生成领域开辟了新的可能性。

FacelessVideos.AI - AI无脸短视频快速生成平台

AI工具AI视频生成FacelessVideos.ai内容创作短视频制作社交媒体营销

FacelessVideos.AI是一个AI驱动的视频生成平台，专为YouTube和TikTok创作者设计。利用先进的AI技术，该工具能根据简短描述自动生成引人注目的无脸短视频，操作简便快捷。平台旨在帮助内容创作者快速制作高质量短视频，提升社交媒体影响力和账户活跃度。采用月付订阅模式，用户每月可生成200个视频，是追求效率的视频创作者的理想自动化短视频制作解决方案。

VideoTetris - 创新视频生成技术实现复杂语义精确组合

GithubVideoTetris开源项目文本到视频生成时空组合扩散组合式生成长视频生成

VideoTetris是一个视频生成框架，采用时空组合扩散技术实现复杂文本语义的精确表达。通过操控去噪网络的注意力图，在空间和时间维度上控制视频生成。项目提出了视频数据预处理方法，提升了训练数据的动态性和提示理解能力。VideoTetris可生成10秒至2分钟或更长的视频，为复杂场景视频生成提供了新方案。

ShareGPT4Video - 通过字幕提高视频理解和生成

AI模型GithubShareGPT4Video开源项目视频字幕视频理解视频生成

ShareGPT4Video项目通过应用高精度字幕显著提升视频理解与生成的效果。该项目提供功能强大的文本至视频模型，支持多种视频时长和分辨率，并设有两种优化效率与质量的推断模式。该项目的目标是通过高质量视频字幕数据集改善文本到视频的转换效果，从而提升大型视频语言模型的理解能力。

ShortVideoGen - 高效AI短视频生成平台

AI工具ShortVideoGen人工智能文本转视频短视频生成订阅计划

ShortVideoGen是一个创新的text to video平台，结合先进的AI Video Generator技术，将文本快速转化为带音频的短视频。用户只需三步即可完成创作：输入文本、自定义参数、生成视频。平台提供多种订阅选项，适应不同需求。网站还展示了多样化的视频示例，突显其广泛应用价值。

AI-Shorts-Creator - AI智能视频剪辑工具

AI-Shorts-CreatorFFmpegGPT-4Github人脸检测开源项目视频剪辑

AI-Shorts-Creator是一款为内容创作者、播客和视频爱好者设计的工具，通过GPT-4分析视频转录，自动提取精彩片段。结合FFmpeg和OpenCV，实现高效视频裁剪，突出关键亮点，提升观看体验。支持多种视频格式，兼容性强，节省手动编辑时间，提升视频创作效率。

pix2pixHD - 高分辨率图像到图像转换及语义编辑

GANsGithubpix2pixHD图像翻译开源项目语义操控高分辨率

此Pytorch实现的高分辨率图像到图像转换方法（如2048x1024），可以将语义标签图转化为真实感图像，或从面部标签图生成肖像。该项目适用于街景和肖像等图像生成及交互编辑。需要NVIDIA GPU，提供详细的安装、测试和训练指南，支持多GPU和自动混合精度训练。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com