#变分自编码器

PyTorch-VAE学习资料汇总 - 一个变分自编码器的PyTorch实现集合

2 个月前
Cover of PyTorch-VAE学习资料汇总 - 一个变分自编码器的PyTorch实现集合

VITS入门指南 - 强大的端到端语音合成模型

2 个月前
Cover of VITS入门指南 - 强大的端到端语音合成模型

RAVE入门学习资料 - 高质量实时神经音频合成模型

2 个月前
Cover of RAVE入门学习资料 - 高质量实时神经音频合成模型

Pythae:一个统一的Python生成式自编码器库

3 个月前
Cover of Pythae:一个统一的Python生成式自编码器库

基于深度强化学习的CARLA自动驾驶技术实现

3 个月前
Cover of 基于深度强化学习的CARLA自动驾驶技术实现

PyTorch-VAE: 变分自编码器的综合实现与应用

3 个月前
Cover of PyTorch-VAE: 变分自编码器的综合实现与应用

VITS: 端到端文本转语音的新突破

3 个月前
Cover of VITS: 端到端文本转语音的新突破

RAVE: 革命性的实时神经音频合成技术

3 个月前
Cover of RAVE: 革命性的实时神经音频合成技术
相关项目
Project Cover

RAVE

RAVE是一个高效的变分自动编码器,专为快速高质量的神经音频合成设计。支持Windows、Mac和Linux平台的RAVE VST版本,可应用于音乐表演和装置。提供详细教程和多种训练配置,包括数据增广选项。用户可以在Max/MSP或PureData中实时使用RAVE进行风格迁移和高层次操控。多个预训练模型可供下载,支持批量音频文件转换和实时嵌入式平台应用。

Project Cover

PyTorch-VAE

PyTorch-VAE项目实现了多种变分自编码器(VAE),专注于结果的可重复性,包括从Vanilla VAE到VQ-VAE的众多模型。所有模型都在CelebA数据集上训练,确保一致的对比结果。代码简洁易用,支持PyTorch和PyTorch Lightning,适合研究人员和开发者快速构建、调试和优化VAE模型。

Project Cover

vits

VITS是一种结合变分自编码器和对抗学习的端到端TTS系统,能够提升语音合成的自然度。通过变分推理和正态化流,以及随机时长预测器,VITS实现了多样节奏的语音合成。实验结果表明,该方法在LJ Speech数据集上的表现优于现有的TTS系统,接近真实语音的水平。

Project Cover

Autonomous-Driving-in-Carla-using-Deep-Reinforcement-Learning

该项目在CARLA仿真环境中,使用深度强化学习方法进行自动驾驶训练。通过结合PPO算法和变分自编码器(VAE),加速学习并提高驾驶决策能力。项目采用Python和PyTorch构建,重点在于自动驾驶和障碍物回避的持续学习。对于推动自动驾驶技术和决策效率研究具有显著意义。

Project Cover

benchmark_VAE

pythae库实现多种常见的变分自编码器模型,提供相同自编码神经网络架构下的基准实验和比较。用户可以用自己的数据和编码器、解码器网络训练这些模型,并集成wandb、mlflow和comet-ml等实验监控工具。最新版本支持PyTorch DDP分布式训练,提高训练速度和处理大数据集的能力。支持从HuggingFace Hub进行模型共享和加载,代码简洁高效。涵盖多种已实现模型和采样器,满足不同研究需求。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号