#GAN

UnivNet学习资料汇总 - 高保真波形生成的神经声码器

2 个月前
Cover of UnivNet学习资料汇总 - 高保真波形生成的神经声码器

iGAN入门指南 - 交互式图像生成工具

2 个月前
Cover of iGAN入门指南 - 交互式图像生成工具

Image Super-Resolution 学习资料汇总 - 放大图像并运行实验的开源项目

2 个月前
Cover of Image Super-Resolution 学习资料汇总 - 放大图像并运行实验的开源项目

GAN-MNIST: 用生成对抗网络生成手写数字

3 个月前
Cover of GAN-MNIST: 用生成对抗网络生成手写数字

JGAN: 高速生成对抗网络模型库的革新之作

3 个月前
Cover of JGAN: 高速生成对抗网络模型库的革新之作

生成对抗网络(GANs)入门指南:原理、应用与实现

3 个月前
Cover of 生成对抗网络(GANs)入门指南:原理、应用与实现

2dimageto3dmodel: 从单一2D图像生成3D模型的高效损失函数

3 个月前
Cover of 2dimageto3dmodel: 从单一2D图像生成3D模型的高效损失函数

GANs和其他模型在表格数据生成中的应用与进展

3 个月前
Cover of GANs和其他模型在表格数据生成中的应用与进展

DoppelGANger: 使用GAN生成高保真度合成时间序列数据集

3 个月前
Cover of DoppelGANger: 使用GAN生成高保真度合成时间序列数据集

JoliGEN: 一个强大的生成式AI图像工具集

3 个月前
Cover of JoliGEN: 一个强大的生成式AI图像工具集
相关项目
Project Cover

image-super-resolution

本项目旨在通过实现多种残差密集网络(RDN)和残差在残差密集网络(RRDN)来提升低分辨率图像的质量,并支持Keras框架。项目提供了预训练模型、训练脚本以及用于云端训练的Docker脚本。适用于图像超分辨率处理,兼容Python 3.6,开源并欢迎贡献。

Project Cover

iGAN

系统采用深度生成模型(如GAN和DCGAN),提供智能绘图界面,支持用户通过简单笔触实时生成逼真图像样本。用户可通过颜色和形状的画笔进行编辑,系统自动生成符合编辑的图像。此外,该系统也是一种交互式视觉调试工具,帮助开发者理解和可视化深度生成模型的能力与局限性。

Project Cover

univnet

UnivNet是一种利用多分辨率频谱鉴别器的神经声码器,旨在提供高保真波形生成。本项目包括一个非官方PyTorch实现,并可与原始研究的客观评分相匹敌。它在主观评测中胜过HiFi-GAN,推理速度也比HiFi-GAN快1.5倍。项目还提供预置的训练参数和预训练模型,支持高度自定义和不同的音频数据源。

Project Cover

shared_colab_notebooks

该项目旨在分享和存储各种Google Colab笔记本,包含了丰富的自然语言处理、计算机视觉和GANs领域的示例和教程。笔记本资源由作者创建或修改,适用于开发者和研究人员。用户可以找到Transformers细调、OCR自定义、3D照片修复和流媒体应用创建等实际案例,快速获取并分享高质量的Colab笔记本资源,加速科研与开发进程。

Project Cover

AI-text-to-video-model-from-scratch

完整指南教你使用Python从零构建AI文本生成视频模型,详细介绍理论概念、GAN架构、代码实现和训练过程。了解如何在普通硬件上高效训练小规模模型,实现文本到视频的转换。

Project Cover

DragGAN

DragGAN项目介绍了一种基于交互点操作的生成图像技术,可以在生成图像流形上进行精确调整。内容包括技术实现步骤如安装依赖、运行Docker、下载预训练权重和使用GUI进行图像编辑。该项目关键是集成了StyleGAN3和部分StyleGAN-Human代码,提供一个在Linux和Windows系统上高效运行的图像编辑工具。代码遵循CC-BY-NC许可,部分源代码基于Nvidia Source Code License。

Project Cover

torchsde

这个库提供了支持GPU和高效反向传播的随机微分方程(SDE)求解器。其使用Python和PyTorch开发,安装方便,并附有丰富的示例。用户可以通过简单的代码示例快速入门,并通过文档进一步学习。除了基础功能外,还包括潜在SDE和GAN中的SDE等高级应用示例。适用于在高性能计算环境中执行复杂SDE模型的研究人员和开发者。

Project Cover

musegan

MuseGAN项目致力于生成多轨乐器的复音音乐。通过使用Lakh Pianoroll Dataset进行训练,该模型可以从零开始生成音乐或为用户提供的轨道进行伴奏。最新版本使用3D卷积层处理时间结构,尽管网络规模较小,但可控性有所下降。项目支持PyTorch版本,并提供多个shell脚本用于实验管理和数据收集。生成样本存储为.npy、.png和.npz格式,可转换为MIDI文件进一步使用。

Project Cover

annotated_deep_learning_paper_implementations

该项目提供详细文档和解释的简明PyTorch神经网络及算法实现,涵盖Transformer、GPT-NeoX、GAN、扩散模型等前沿领域,并每周更新新实现,帮助研究者和开发者高效理解深度学习算法。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号