Logo

#GAN

Logo of annotated_deep_learning_paper_implementations
annotated_deep_learning_paper_implementations
该项目提供详细文档和解释的简明PyTorch神经网络及算法实现,涵盖Transformer、GPT-NeoX、GAN、扩散模型等前沿领域,并每周更新新实现,帮助研究者和开发者高效理解深度学习算法。
Logo of shared_colab_notebooks
shared_colab_notebooks
该项目旨在分享和存储各种Google Colab笔记本,包含了丰富的自然语言处理、计算机视觉和GANs领域的示例和教程。笔记本资源由作者创建或修改,适用于开发者和研究人员。用户可以找到Transformers细调、OCR自定义、3D照片修复和流媒体应用创建等实际案例,快速获取并分享高质量的Colab笔记本资源,加速科研与开发进程。
Logo of musegan
musegan
MuseGAN项目致力于生成多轨乐器的复音音乐。通过使用Lakh Pianoroll Dataset进行训练,该模型可以从零开始生成音乐或为用户提供的轨道进行伴奏。最新版本使用3D卷积层处理时间结构,尽管网络规模较小,但可控性有所下降。项目支持PyTorch版本,并提供多个shell脚本用于实验管理和数据收集。生成样本存储为.npy、.png和.npz格式,可转换为MIDI文件进一步使用。
Logo of aura-sr
aura-sr
AuraSR是一款基于GAN技术的图像超分辨率工具,专为真实世界图像设计。作为GigaGAN论文的变体,它用于图像条件下的放大。该开源项目基于Torch实现,提供简洁的Python API,支持4倍图像放大,并能减少接缝伪影。AuraSR安装使用便捷,为开发者和研究者提供了强大的图像处理工具,适用于多种需要高质量图像增强的场景。
Logo of stylegan2-ada-pytorch
stylegan2-ada-pytorch
StyleGAN2-ADA-PyTorch是StyleGAN2的PyTorch实现版本,专为小数据集训练优化。它采用自适应判别器增强技术,提高了训练稳定性。该框架保持了原TensorFlow版本的功能,同时改进了性能和兼容性。预训练模型涵盖人脸、动物等多个领域,为GAN的新应用探索奠定基础。
Logo of 2dimageto3dmodel
2dimageto3dmodel
该项目开发了一种新型损失函数,能够直接从单张2D图像生成3D模型,无需复杂的渲染过程。项目采用条件GAN架构实现纹理映射,并优化了点云到3D网格的转换技术。在CUB鸟类和Pascal 3D+数据集上的测试显示了显著效果。此外,项目还提供预训练模型、伪真值生成和网格生成器训练等功能,为3D重建研究领域贡献了实用工具和参考方法。
Logo of JGAN
JGAN
JGAN项目在Jittor深度学习框架上实现了27种经典生成对抗网络(GAN)模型,包括ACGAN、CycleGAN和DCGAN等。相比PyTorch,这些模型平均加速185%,最高达283%。项目提供详细使用说明和性能对比数据,为GAN研究和应用开发提供全面的模型库支持。
Logo of image-super-resolution
image-super-resolution
本项目旨在通过实现多种残差密集网络(RDN)和残差在残差密集网络(RRDN)来提升低分辨率图像的质量,并支持Keras框架。项目提供了预训练模型、训练脚本以及用于云端训练的Docker脚本。适用于图像超分辨率处理,兼容Python 3.6,开源并欢迎贡献。
Logo of AI-text-to-video-model-from-scratch
AI-text-to-video-model-from-scratch
完整指南教你使用Python从零构建AI文本生成视频模型,详细介绍理论概念、GAN架构、代码实现和训练过程。了解如何在普通硬件上高效训练小规模模型,实现文本到视频的转换。
Logo of Coloring-greyscale-images
Coloring-greyscale-images
通过本教程,学习如何利用神经网络为黑白照片自动上色。从基础到高级的GAN版本,逐步增加网络复杂度和自动化训练流程。教程覆盖安装步骤、数据集推荐及使用指南,适合各级用户。
Logo of DeSRA
DeSRA
DeSRA项目开发了创新方法,用于检测和消除GAN实际场景超分辨率模型中的伪影。该方法能高效识别伪影区域,通过微调策略消除同类伪影,只需少量样本即可。这一技术突破缩小了超分辨率算法在实际应用中的差距,为图像质量提升开辟了新途径。
Logo of DoppelGANger
DoppelGANger
DoppelGANger是一个基于生成对抗网络(GAN)的时间序列数据生成框架。它通过解决长期依赖性和复杂多维关系等挑战,在多个真实数据集上实现了比基准模型高43%的保真度。该框架为网络系统研究提供了一种共享高质量合成数据集的通用方法,有助于推动数据共享实践。DoppelGANger已获得多家公司采用,并提供开源代码实现。
Logo of GAN-MNIST
GAN-MNIST
此项目展示了使用TensorFlow实现生成对抗网络(GAN)处理MNIST手写数字数据集。项目包含模型定义、训练脚本和图像处理工具,支持MNIST和CelebA人脸数据集。通过生成样本的可视化结果,展示了GAN生成逼真手写数字图像的能力。项目代码复现了Theano版本的实现,为开发者提供了学习和实践GAN技术的参考资源。
Logo of iGAN
iGAN
系统采用深度生成模型(如GAN和DCGAN),提供智能绘图界面,支持用户通过简单笔触实时生成逼真图像样本。用户可通过颜色和形状的画笔进行编辑,系统自动生成符合编辑的图像。此外,该系统也是一种交互式视觉调试工具,帮助开发者理解和可视化深度生成模型的能力与局限性。
Logo of DragGAN
DragGAN
DragGAN项目介绍了一种基于交互点操作的生成图像技术,可以在生成图像流形上进行精确调整。内容包括技术实现步骤如安装依赖、运行Docker、下载预训练权重和使用GUI进行图像编辑。该项目关键是集成了StyleGAN3和部分StyleGAN-Human代码,提供一个在Linux和Windows系统上高效运行的图像编辑工具。代码遵循CC-BY-NC许可,部分源代码基于Nvidia Source Code License。
Logo of ydata-synthetic
ydata-synthetic
ydata-synthetic项目提供了多种工具用于合成数据生成,支持前沿的生成模型如Generative Adversarial Networks (GANs)和高斯混合模型。该项目可以生成保护隐私的合成数据,且有助于消除数据偏差,平衡和扩展数据集。全新streamlit应用程序允许用户在无需编程的情况下快速生成合成数据。常见问题、快速入门指南和Jupyter Notebooks实例帮助用户轻松入门。加入Discord社区获取更多技术支持。
Logo of AuraSR
AuraSR
AuraSR是一款基于GigaGAN的图像超分辨率工具,可将低分辨率图像放大4倍,且支持重复应用。该工具擅长处理文本生成的图像,支持PNG、JPG、JPEG和WEBP格式输入,输出高清WEBP格式。AuraSR重视数据安全,提供社交媒体分享功能。目前免费使用,未来将推出付费计划,提供更多高级功能。
Logo of joliGEN
joliGEN
joliGEN是一个集成框架,用于训练自定义的AI图像转换模型。该框架集成了GAN、扩散和一致性模型,可用于配对和无配对的图像转换任务。joliGEN适用于图像生成控制、增强现实和数据集增强等实际场景。它支持快速稳定的训练过程,并提供REST API服务简化部署。凭借丰富的选项和参数,joliGEN可应用于多种图像生成和处理任务。
Logo of Tabular-data-generation
Tabular-data-generation
Tabular-data-generation是一个开源的表格数据生成工具库,集成了GAN、TimeGAN、扩散模型和大语言模型等多种生成技术。通过简洁的API,研究人员可方便地生成高质量合成数据,应用于数据增强和隐私保护等领域。项目提供了完整的使用文档、实验设计和结果分析,为表格数据生成研究提供了有价值的参考资源。
Logo of univnet
univnet
UnivNet是一种利用多分辨率频谱鉴别器的神经声码器,旨在提供高保真波形生成。本项目包括一个非官方PyTorch实现,并可与原始研究的客观评分相匹敌。它在主观评测中胜过HiFi-GAN,推理速度也比HiFi-GAN快1.5倍。项目还提供预置的训练参数和预训练模型,支持高度自定义和不同的音频数据源。
Logo of torchsde
torchsde
这个库提供了支持GPU和高效反向传播的随机微分方程(SDE)求解器。其使用Python和PyTorch开发,安装方便,并附有丰富的示例。用户可以通过简单的代码示例快速入门,并通过文档进一步学习。除了基础功能外,还包括潜在SDE和GAN中的SDE等高级应用示例。适用于在高性能计算环境中执行复杂SDE模型的研究人员和开发者。
Logo of bigvsan
bigvsan
BigVSAN项目结合GAN神经声码器和切片对抗网络,旨在提高音频生成质量。该项目基于LibriTTS数据集训练,提供预训练模型及完整的代码实现。包括训练、评估和推理功能,并附有详细使用说明。在多项客观评估指标中,BigVSAN展现出优秀性能,为语音合成技术开辟新方向。
Logo of This Person Does Not Exist
This Person Does Not Exist
This Person Does Not Exist利用人工智能技术生成虚拟人物、动物和艺术图像。网站免费提供各种年龄和性别的随机人脸图像生成和下载服务。这些AI生成的图像可用于创意项目,但禁止用于非法用途。平台展示了AI技术在图像生成领域的应用,为用户提供了探索人工智能发展的机会。
Logo of DeepImage-an-Image-to-Image-technology
DeepImage-an-Image-to-Image-technology
DeepImage是一个综合性的图像生成与转换技术项目,包含多种先进算法如pix2pixHD、pix2pix和CycleGAN等。该项目提供了图像生成演示、理论研究资料和实践指南,涵盖从基础到前沿的生成对抗网络(GAN)技术。DeepImage为研究人员和开发者提供了一个全面的学习和实验平台,助力探索图像生成与转换的多种可能性。
Logo of generative_adversarial_networks_101
generative_adversarial_networks_101
该项目全面介绍生成对抗网络(GANs)的基本概念和应用实践。内容涵盖多种GAN模型在MNIST和CIFAR-10数据集上的具体实现,包括DCGAN、CGAN等。通过详细的代码示例、训练过程和结果可视化,展示了GAN的工作原理。项目还提供丰富的参考资料和相关论文,为深入学习和实践GAN提供了有价值的资源。