#GAN

UnivNet学习资料汇总 - 高保真波形生成的神经声码器

2 个月前

UnivNet 神经合成器高保真波形生成音频样本 GAN Github 开源项目

2 个月前

iGAN入门指南 - 交互式图像生成工具

2 个月前

iGAN GAN 交互式图像生成深度生成模型图像翻译 Github 开源项目

2 个月前

Image Super-Resolution 学习资料汇总 - 放大图像并运行实验的开源项目

2 个月前

Image Super-Resolution Keras Residual Dense Networks PSNR GAN Github 开源项目

2 个月前

GAN-MNIST: 用生成对抗网络生成手写数字

3 个月前

GAN MNIST TensorFlow 深度学习图像生成 Github 开源项目

3 个月前

JGAN: 高速生成对抗网络模型库的革新之作

3 个月前

GAN Jittor PyTorch 深度学习人工智能 Github 开源项目

3 个月前

生成对抗网络(GANs)入门指南：原理、应用与实现

3 个月前

GAN 生成对抗网络深度学习人工智能图像生成 Github 开源项目

3 个月前

2dimageto3dmodel: 从单一2D图像生成3D模型的高效损失函数

3 个月前

3D模型生成单图重建损失函数点云 GAN Github 开源项目

3 个月前

GANs和其他模型在表格数据生成中的应用与进展

3 个月前

GAN 表格数据生成时间序列生成数据增强机器学习 Github 开源项目

3 个月前

DoppelGANger: 使用GAN生成高保真度合成时间序列数据集

3 个月前

GAN 时间序列数据数据共享数据隐私 DoppelGANger Github 开源项目

3 个月前

JoliGEN: 一个强大的生成式AI图像工具集

3 个月前

JoliGEN 生成式AI 图像处理 GAN 扩散模型 Github 开源项目

3 个月前

相关项目

image-super-resolution

本项目旨在通过实现多种残差密集网络（RDN）和残差在残差密集网络（RRDN）来提升低分辨率图像的质量，并支持Keras框架。项目提供了预训练模型、训练脚本以及用于云端训练的Docker脚本。适用于图像超分辨率处理，兼容Python 3.6，开源并欢迎贡献。

iGAN

系统采用深度生成模型（如GAN和DCGAN），提供智能绘图界面，支持用户通过简单笔触实时生成逼真图像样本。用户可通过颜色和形状的画笔进行编辑，系统自动生成符合编辑的图像。此外，该系统也是一种交互式视觉调试工具，帮助开发者理解和可视化深度生成模型的能力与局限性。

univnet

UnivNet是一种利用多分辨率频谱鉴别器的神经声码器，旨在提供高保真波形生成。本项目包括一个非官方PyTorch实现，并可与原始研究的客观评分相匹敌。它在主观评测中胜过HiFi-GAN，推理速度也比HiFi-GAN快1.5倍。项目还提供预置的训练参数和预训练模型，支持高度自定义和不同的音频数据源。

shared_colab_notebooks

该项目旨在分享和存储各种Google Colab笔记本，包含了丰富的自然语言处理、计算机视觉和GANs领域的示例和教程。笔记本资源由作者创建或修改，适用于开发者和研究人员。用户可以找到Transformers细调、OCR自定义、3D照片修复和流媒体应用创建等实际案例，快速获取并分享高质量的Colab笔记本资源，加速科研与开发进程。

AI-text-to-video-model-from-scratch

完整指南教你使用Python从零构建AI文本生成视频模型，详细介绍理论概念、GAN架构、代码实现和训练过程。了解如何在普通硬件上高效训练小规模模型，实现文本到视频的转换。

DragGAN

DragGAN项目介绍了一种基于交互点操作的生成图像技术，可以在生成图像流形上进行精确调整。内容包括技术实现步骤如安装依赖、运行Docker、下载预训练权重和使用GUI进行图像编辑。该项目关键是集成了StyleGAN3和部分StyleGAN-Human代码，提供一个在Linux和Windows系统上高效运行的图像编辑工具。代码遵循CC-BY-NC许可，部分源代码基于Nvidia Source Code License。

torchsde

这个库提供了支持GPU和高效反向传播的随机微分方程（SDE）求解器。其使用Python和PyTorch开发，安装方便，并附有丰富的示例。用户可以通过简单的代码示例快速入门，并通过文档进一步学习。除了基础功能外，还包括潜在SDE和GAN中的SDE等高级应用示例。适用于在高性能计算环境中执行复杂SDE模型的研究人员和开发者。

musegan

MuseGAN项目致力于生成多轨乐器的复音音乐。通过使用Lakh Pianoroll Dataset进行训练，该模型可以从零开始生成音乐或为用户提供的轨道进行伴奏。最新版本使用3D卷积层处理时间结构，尽管网络规模较小，但可控性有所下降。项目支持PyTorch版本，并提供多个shell脚本用于实验管理和数据收集。生成样本存储为.npy、.png和.npz格式，可转换为MIDI文件进一步使用。

annotated_deep_learning_paper_implementations

该项目提供详细文档和解释的简明PyTorch神经网络及算法实现，涵盖Transformer、GPT-NeoX、GAN、扩散模型等前沿领域，并每周更新新实现，帮助研究者和开发者高效理解深度学习算法。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com