Project Icon

Generative-AI

多模态图像合成与编辑技术及其分类

该项目附有一篇综述论文,全面分析了多模态图像合成与编辑(MISE)和视觉AIGC的发展情况,并根据数据模态和模型架构进行了分类研究。通过此项研究,科研人员和技术开发者可以深入了解神经渲染、扩散方法、自回归方法及对抗生成网络(GAN)等不同技术及其应用,帮助更好地掌握多模态图像合成技术的前沿进展与实际应用。

GAN-Inversion - GAN逆映射技术的最新进展及应用综述
3D生成对抗网络GAN InversionGithubStyleGAN图像合成开源项目潜在空间编辑
本资源集合汇总了GAN逆映射技术的最新研究成果,包括2D和3D方法、预训练模型、潜在空间编辑及其在图像生成、操纵和理解等领域的应用。作为相关综述论文的补充,该项目追踪并总结了这一快速发展领域的进展,为研究人员和开发者提供全面参考。
awesome-generative-ai - 生成式人工智能资源集合,包括最新的学术研究、技术开发、在线教学与实用工具
Generative AIGithub人工智能在线教程大型语言模型开源项目技术文章
Awesome Generative AI聚合了范围广泛的生成式人工智能资源,包括最新的学术研究、技术开发、在线教学与实用工具。更新频繁,内容全面,是AI专业人士和爱好者不可错过的财富库。
PortraitGen-code - 肖像视频编辑技术,结合多模态生成模型
3D重建GithubPortraitGen多模态生成开源项目视频编辑风格迁移
这个项目实现了一种创新的肖像视频编辑方法,采用多模态生成模型来实现统一且高表达力的风格转换,能够处理单目RGB视频中的文本和图像驱动的高质量编辑以及光照调整,从而提高面部结构呈现的质量。
ArtGAN - 深度学习驱动的艺术品生成与分类开源项目
ArtGANGithub图像分类开源项目数据集深度学习艺术生成
ArtGAN是一个融合深度学习与艺术的开源项目,专注于艺术作品的生成和分类。项目包含WikiArt数据集、改进的ArtGAN模型用于条件合成图像和艺术品,以及深度卷积网络用于绘画分类。通过生成高质量肖像画,ArtGAN展示了AI在艺术领域的应用潜力。该项目不仅为学术研究提供了重要资源,还为艺术创作和鉴赏开拓了新视角。项目由三个主要部分组成:精炼的WikiArt数据集、用于条件合成图像的改进ArtGAN模型,以及用于绘画分类的深度卷积网络。这些组件共同构成了一个全面的艺术智能研究平台,为探索AI与艺术的交叉领域提供了有力支持。
Awesome-Image-Composition - 图像合成领域资源精选 从论文到工具的全面集合
AIGCGithub人工智能图像合成开源项目深度学习计算机视觉
Awesome-Image-Composition汇集了图像合成领域的核心资源,包括论文、数据集和相关链接。涵盖图像融合、调和、阴影生成和对象放置等多个子领域,该项目为研究人员和开发者提供了全面的参考资料。此外,项目还包含在线演示和实用工具箱,方便用户实践和探索图像合成技术。收录了超过100篇高质量论文和20多个开源工具,是图像合成研究和应用的首选资源库。
Awesome-AIGC-3D - 最新生成式3D模型技术和资源汇总
3D生成AIGCGithub开源项目扩散模型深度学习神经辐射场
Awesome-AIGC-3D是一个精选的AIGC 3D论文资源列表,涵盖了从物体到场景生成的多种3D生成方法。项目包括最新的扩散模型、神经辐射场等技术,并收录了相关综述文章、基准数据集和实现代码。这为3D生成领域的研究人员和开发者提供了全面的技术参考。
Imagen - 文字生成图片的AI技术
AI工具AI开发COCO FIDImagen扩散模型文本到图像模型训练热门语言模型
Imagen,一种先进的AI图片生成工具,利用深度语言理解和极致的图像真实性,实现从文字到图像的转换。此模型不仅在COCO数据集上刷新了技术记录,还通过高效的U-Net架构和强大的文本编码系统,优化了图文一致性和图像质量。鉴于潜在的社会影响和数据集偏差问题,当前未开放源代码或公共演示版本。
awesome-ai-art-image-synthesis - AI图像生成与提示工程工具集合
AI ArtDalle2GithubMidJourneyPrompt EngineeringStableDiffusion开源项目
全面介绍Dalle2、MidJourney、StableDiffusion等AI图像生成工具和技术。提供适合初学者和高级用户的实用工具、提示和技巧,以及丰富的资源,包括商业和开源模型、提示工程工具、后处理工具和社区支持。无论是了解如何使用这些工具生成图像,还是寻找灵感和学习资源,这里都能满足需求。
generative-models - SV4D与SV3D一类的创新模型
GithubSDXL-TurboSV3DSV4D开源项目热门稳定AI视频合成
Generative Models项目展示了多个创新模型如SV4D与SV3D,专注于视频到4D扩散建模和图像到视频的多视角合成,旨在提供高分辨率和时间连贯性的研究工具。最新技术报告和视频概览现已发布,支持通过简单的脚本和快速入门指南直接体验模型效果,适用于研究及教育用途。
gill - 使用多模态语言模型的图像生成方法
CC3MGILLGithub图像生成多模态语言模型开源项目训练
GILL模型可处理交互的图像和文本输入以生成文本、检索图像及生成新图像。本文详细介绍了GILL模型的代码、预训练权重、环境设置、预训检查点和视觉嵌入的安装步骤。此外,还包括推理、训练及评估的指南,及启动Gradio演示的操作步骤。更多详情请参阅相关研究论文及项目页面。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号