Project Icon

MuseV

开源虚拟人视频生成框架支持无限长度输出

MuseV是一个基于扩散模型的开源虚拟人视频生成框架。该框架支持无限长度视频生成,采用视觉条件并行去噪方案,兼容Stable Diffusion生态系统。MuseV支持图像到视频、文本到视频、视频到视频等多种生成模式,并提供多参考图像技术。该项目还开源了训练代码,为研究人员和开发者提供了完整的虚拟人视频生成解决方案。

MuseChat - AI角色定制平台 - 释放想象力的新方式
AI人物定制AI伴侣AI小说创作AI工具AI角色创建数字分身
MuseChat是一个创新的AI角色定制平台,支持用户设计和互动独特的AI角色。平台功能包括个性定制、背景故事上传和声音视觉特征添加。应用场景广泛,涵盖数字分身创建、AI辅助写作等。MuseChat致力于提供一个激发想象力的环境,实现AI角色创作的无限可能。
MotionClone - 从参考视频克隆动作实现可控文本到视频生成
AI控制GithubMotionClone动作克隆开源项目文本到视频视频生成
MotionClone是一个无需训练的框架,通过从参考视频克隆动作来控制文本到视频的生成。该项目采用时间注意力机制和位置感知语义引导,有效处理微妙动作并提升生成模型的提示理解能力。MotionClone为视频创作和研究提供了全面的动作和语义指导工具,推动了可控视频生成技术的发展。
magvit2-pytorch - MagViT2视频生成和理解模型的PyTorch开源实现
AI模型GithubMagViT2Pytorch实现开源项目视频生成语言模型
MagViT2是基于语言模型的最新视频生成和理解技术。该PyTorch实现提供高效视频标记器和训练器,支持大规模数据集。项目包含无查找量化器,适用于多种模态。灵活架构设计允许自定义层和注意力机制,为研究人员提供探索和改进视频生成技术的工具。
musegan - 多轨乐器生成与伴奏的AI工具
GANGithubMuseGAN多轨道音乐开源项目深度学习音乐生成
MuseGAN项目致力于生成多轨乐器的复音音乐。通过使用Lakh Pianoroll Dataset进行训练,该模型可以从零开始生成音乐或为用户提供的轨道进行伴奏。最新版本使用3D卷积层处理时间结构,尽管网络规模较小,但可控性有所下降。项目支持PyTorch版本,并提供多个shell脚本用于实验管理和数据收集。生成样本存储为.npy、.png和.npz格式,可转换为MIDI文件进一步使用。
Stability AI - 多模态生成式AI技术的开源先锋
AI工具Stable Diffusion图像生成开源模型生成式AI视频生成
Stability AI专注于开发多模态生成式AI技术,提供开源模型如Stable Diffusion 3(图像生成)、Stable Video Diffusion(视频生成)、Stable Audio 2.0(音频生成)和StableLM(语言处理)。公司致力于通过开放模型和灵活许可,为全球用户提供先进AI解决方案,支持商业和非商业应用,以激发人类创造潜能。
motionshop - 视频角色3D化身替换应用 让创意无限
3D头像AI视频处理GithubMotionShop人物动画开源项目视频替换
MotionShop是一个开源应用程序,可将视频中的真实人物替换为3D虚拟化身。该应用可用于视频创作、虚拟现实内容制作等领域,为创作者提供新的表现形式。项目已在ModelScope上线体验demo,计划在HuggingFace推出。开发团队持续优化项目,鼓励用户体验并分享创作成果。
photoMovieX - 基于Stable Diffusion的电影级AI图像生成模型
AI绘图GithubHuggingfaceMagicArt35Stable Diffusion图像生成开源项目模型科幻风格
photoMovieX是一个基于Stable Diffusion的AI图像生成模型,专注于创造电影级画面。该模型能够融合科幻、复古和超现实主义元素,通过文本提示词生成未来感建筑、复古人物肖像和奇幻场景等独特视觉作品。photoMovieX在创造具有电影感和艺术性的图像方面表现出色,为创意工作者提供了丰富的创作素材。
GPT-vup - 实时互动AI直播数字人系统
AI交互GPT-vupGithubVTube Studio开源项目数字人直播直播功能
GPT-vup是一个基于生产者-消费者模型的AI直播数字人项目,支持哔哩哔哩和抖音平台。该系统集成OpenAI嵌入技术和GPT-3.5 API,提供实时弹幕互动、欢迎观众和感谢礼物等基本功能。通过插件系统,GPT-vup还实现了语音交互、动作匹配、定时事件触发和上下文补充等高级特性,为直播增添智能化和个性化元素。
KandinskyVideo - 先进的开源文本到视频生成模型
GithubKandinsky Video 1.1人工智能开源模型开源项目文本生成视频视频生成技术
KandinskyVideo 1.1是一个开源的文本到视频生成模型,在EvalCrafter基准测试中表现突出。该模型采用三阶段生成流程:初始帧生成、关键帧生成和帧插值,有效提高了视频质量和内容连贯性。除了支持文本到视频转换,KandinskyVideo 1.1还能为输入图像添加动画效果。在视觉质量、文本-视频对齐、动作质量和时间连贯性等方面,该模型都展现出优秀性能,体现了开源文本到视频生成技术的最新发展。
AI-Vtuber - 整合多模型的开源AI虚拟主播项目
GithubLuna AI人工智能开源项目直播平台自然语言处理虚拟主播
Luna AI是一个开源的AI虚拟主播项目,集成了多种大语言模型和外观技术。该系统支持Live2D、UE5等视觉呈现,使用文本转语音技术实现自然交流。Luna AI可在主流直播平台进行实时互动,并能与Stable Diffusion结合展示画作。这个免费开源项目为开发者和用户提供了全面的虚拟主播解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号