Project Icon

playground-v2-1024px-aesthetic

高分辨率图像生成模型提升美学质量

该模型生成1024x1024像素的高美学图像,并在用户偏好研究中表现出色。通过MJHQ-30K评估基准,Playground v2在多个评价指标上表现优于其他模型,尤其在图像的美学质量上。

ponyDiffusion-V6-XL-Turbo-DPO - 基于Diffusers的高效文本生成图像模型
AI绘图GithubHuggingfacePony DiffusionSafetensorsText-to-Image开源项目模型深度学习模型
Pony Diffusion V6 XL Turbo DPO的Diffusers版本保留了原模型的文本到图像生成能力。该版本采用Diffusers框架,提高了处理效率和兼容性。模型支持Safetensors格式,适用于创建多样化的图像内容。这一开源项目为艺术创作和设计应用提供了有力工具。
ddpm-celebahq-256 - 高效的无条件图像生成与渐进解压的新型扩散模型
DDPMGithubHuggingface图像合成图像降噪开源项目无条件图像生成模型深度学习
本项目使用去噪扩散概率模型,实现了高质量的图像合成,借鉴了不平衡热力学,创新性地结合了变分界限和去噪评分匹配,并通过Langevin动力学实现渐进的解压缩。模型在CIFAR10数据集上取得了9.46的Inception得分和3.17的最新FID得分,在256x256 LSUN上样本质量与ProgressiveGAN相近。推理中可使用离散噪声调度器如ddpm、ddim或pndm,ddim和pndm在速度和质量上表现出色。项目支持用户自主训练模型,并提供官方示例用于推理和训练。
MilkyWonderland_v1 - 基于Stable Diffusion的二次元动漫风格图像生成模型
AI绘画GithubHuggingfacestable-diffusion图像生成开源项目文生图模型模型训练
MilkyWonderland_v1是基于Stable Diffusion开发的二次元动漫风格图像生成模型,通过diffusers框架实现文本到图像的转换功能。该模型专注于动漫风格图像的生成,具有稳定的性能表现。
RealVisXL_V3.0 - 高度逼真的AI图像生成模型
AI绘图GithubHuggingfaceRealVisXL图像模型图像生成开源项目模型真实感渲染
RealVisXL_V3.0是一个专注于生成照片级真实感图像的AI模型。该模型能够创作SFW和NSFW内容,具有优秀的细节表现和自然质感。尽管仍处于训练阶段,RealVisXL_V3.0已展现出显著潜力。通过调整采样步骤、方法和高清修复参数,用户可以进一步优化生成效果。这个模型为视觉创作提供了强大的工具支持。
stable-diffusion-xl-base-1.0 - 先进的AI文本转图像生成模型,实现高质量图像创作
AI绘图GithubHuggingfaceSDXLStable Diffusion开源项目扩散模型文本生成图像模型
Stable Diffusion XL 1.0基础模型是一款开源的AI文本转图像工具,采用潜在扩散技术,能根据文字描述生成高质量图像。该模型性能显著提升,适用于艺术创作、教育和研究等领域。它支持多种框架,为开发者提供灵活的应用选择。作为开源项目,它展现了AI图像生成的最新进展,不仅能创建高质量图像,还支持图像修改功能。
epiCRealism - Stable Diffusion模型实现真实感图像生成
AI绘图GithubHuggingFaceHuggingfaceStable Diffusion开源项目文本生成图像机器学习模型模型
epiCRealism是一个基于Stable Diffusion的开源模型,专注于生成高质量真实感图像。该模型支持多种场景创作,包括人像、风景和幻想题材,能够呈现细腻的细节和逼真效果。epiCRealism易于集成到各类图像生成项目中,为创作者和开发者提供了实现视觉创意的有力工具。
perfectlevel10 - 通过稳定扩散技术革新图像生成
AI绘图GithubHuggingfacediffusersstable-diffusion图像生成开源项目文本转图像模型
PerfectLevel10结合稳定扩散和文本转图像技术,旨在提升图像生成的质量和效率。使用长尾关键词如稳定扩散和diffusers,该项目适用于多种应用场景,并提供详细的项目信息、更新和使用案例,方便用户获取所需的信息。
CogView - 中文文字生成逼真图像,支持英文和中文输入
CogViewGithubImageRewardNeurIPS 2023text-to-imagetransformer开源项目
CogView是一个基于4B参数预训练的转换器,用于生成通用领域的文本到图像。最新版本CogView2显著提升了生成速度,并扩展支持英文输入。用户可以通过Github和Wudao平台体验并下载预训练模型。项目还包含超分辨率和图像到文本转换功能,并提供详细的设置和运行指南。该项目获得NeurIPS 2021认可,并推荐使用PB-relax和Sandwich-LN技术稳定训练大型转化器。
karlo-v1-alpha-image-variations - 基于unCLIP的文本条件图像生成模型
GithubHuggingfaceKarlo图像生成开源项目文本到图像模型模型架构超分辨率
Karlo v1 alpha通过优化的unCLIP架构提供了文本条件图像生成方案,提升了图像超分辨率性能。该模型在7个降噪步骤中将图像从64px扩展到256px,增强了高频细节表现。项目使用diffusers库,便于高性能GPU上的简便实现。模型在115M图像文本对上进行从头训练,并应用DDPM目标与VQ-GAN风格损失进行优化。
Imagen - 文字生成图片的AI技术
AI工具AI开发COCO FIDImagen扩散模型文本到图像模型训练热门语言模型
Imagen,一种先进的AI图片生成工具,利用深度语言理解和极致的图像真实性,实现从文字到图像的转换。此模型不仅在COCO数据集上刷新了技术记录,还通过高效的U-Net架构和强大的文本编码系统,优化了图文一致性和图像质量。鉴于潜在的社会影响和数据集偏差问题,当前未开放源代码或公共演示版本。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号