DALLE2-pytorch

Pytorch实现的OpenAI DALL-E 2

DALL-E 2 Pytorch 神经网络文本到图像自监督学习 Github 开源项目

DALL-E 2的Pytorch实现由OpenAI开发，采用先进的神经网络技术将文本描述转化为高质量图像。本版本特别优化扩散先验网络，提供高性能的模型变体。开源项目鼓励开发者通过GitHub和Hugging Face参与贡献，并在Discord社区进行交流和支持。

Github

Huggingface

介绍相关项目

stable-diffusion-2-1-base - 基于稳定扩散技术的高质量文本到图像生成模型

GithubHuggingfaceStable Diffusion人工智能绘图开源项目文本生成图像模型深度学习计算机视觉

stable-diffusion-2-1-base是Stability AI开发的文本到图像生成模型，基于潜在扩散技术。该模型在大规模图像数据集上训练，可根据文本提示生成512x512分辨率的高质量图像。相比之前版本，2.1版本在图像质量和文本理解能力上有所提升。模型适用于艺术创作、设计辅助等场景，可通过Hugging Face Diffusers库轻松使用。

epiCDream - 先进文本转图像模型生成逼真风景和肖像

AI绘图GithubHuggingfaceStable Diffusion开源项目模型科幻场景艺术创作风景画

epiCDream Lullaby是一个基于stable-diffusion技术的文本到图像模型，能生成逼真的风景和肖像图像。该模型可创造蒸汽朋克太空船、人物肖像、宇宙场景和微型森林景观等多样化图像。作为一个灵活的图像生成工具，epiCDream Lullaby适用于创意项目和视觉设计。

DelphiOpenAI - Delphi开源库实现OpenAI API，兼容多平台

APIDelphi OpenAI APIGithubOpenAI人工智能开源项目自然语言处理

DelphiOpenAI项目实现了OpenAI公开API的Delphi版本，支持最新的ChatGPT和DALL-E等功能。兼容所有主要平台，提供文本生成、图片处理和自定义模型等API调用功能。该项目适用于Delphi 10.3及以上IDE版本，安装便捷，无需第三方库，适合多种应用场景。

realistic-vision-v12 - 基于文本生成逼真图像的新技术

AI绘图GithubHuggingfaceRealistic Visiondiffusersstable-diffusion图像生成开源项目模型

Realistic Vision 1.2结合稳定扩散技术和diffusers库，从文本生成高质量的逼真图像。采用CreativeML-OpenRAIL-M许可证，项目为数字创作提供了灵活性和创新性。通过简单的文本提示，用户可以生成多种符合视觉需求的图像，适用于多个创意领域。

pix2pix - 利用条件对抗网络的图像到图像翻译实现

Conditional Adversarial NetworksCycleGANGithubImage-to-Image TranslationPyTorchpix2pix开源项目

使用条件对抗网络实现图像到图像翻译，支持从建筑立面生成到日夜转换等多种任务。该项目能在小数据集上快速产生良好结果，并提供改进版的PyTorch实现。支持多种数据集和模型，并附有详细的安装、训练和测试指南。

transformer_latent_diffusion - 基于 PyTorch 的 Transformer 潜在扩散文本生图模型

AI绘图GithubLatent DiffusionPyTorchTransformer图像生成开源项目

Transformer Latent Diffusion 是一个基于 PyTorch 的开源项目，实现了文本到图像的潜在扩散模型。该模型体积小、生成速度快、性能合理，可在单 GPU 上快速训练。项目代码简洁，依赖少，注重数据质量。它提供数据处理工具，支持自定义训练，并进行了多项性能优化。项目展示了 256 分辨率随机样本和 CLIP 插值等生成示例。

DreamPhotoGASM - 高级写实AI图像生成工具

AI绘图DreamPhotoGithubHuggingfaceStable Diffusion开源项目模型模特真实感

DreamPhotoGASM是一款专注于生成高度写实人物图像的AI工具。该项目结合多种艺术模型，可创建从浪漫场景到时尚写真的多样化图片。它擅长捕捉人物细节，包括面部表情、服装质感和环境光线，为创作者提供了将文字描述转化为视觉艺术的平台。

MeinaPastel_v1 - 文本到图像生成的稳定扩散模型解析

APIGithubHuggingfaceStable Diffusion图像生成开源项目文本到图像模型模型信息

MeinaPastel_v1项目利用稳定扩散和文本到图像生成技术，展示AI模型在图像生成上的应用潜力。用户可以通过Hugginface API或civitai网站查看生成的样例图像，了解其技术能力。该项目为机器学习和图像处理技术爱好者提供了新的研究机会和实用见解。

d2-net - 深度学习驱动的联合特征检测与描述

CNND2-NetGithub开源项目深度学习特征提取计算机视觉

D2-Net是一个用于联合检测和描述局部图像特征的卷积神经网络模型。该项目提供模型实现、预训练权重、特征提取脚本和MegaDepth数据集训练流程。D2-Net在图像匹配和3D重建等计算机视觉任务中表现优异，提高了特征提取的准确性和效率。项目支持多尺度特征提取，并包含在不同数据集上训练的模型权重。

epiCEpic - 增强图像生成与背景一致性的多功能工具

AI绘图GithubHuggingfaceepic-diffusion创意设计开源项目文本到图像模型高分辨率

epiCEpic通过结合Epic Diffusion 1.0和epiCDream，提升了图像生成的背景一致性和细节表现。该工具支持创建从科幻到自然景观的高分辨率图像，展现出在多领域的多功能性，适用于视觉艺术的多种需求。其结合了稳定扩散技术与精致的艺术表现，助力创意与创新。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com