#SoundStorm

SoundStorm-PyTorch: 高效并行音频生成的开源实现

3 个月前

SoundStorm 音频生成 Pytorch 深度学习人工智能 Github 开源项目

3 个月前

SoundStorm: 谷歌新一代高效并行音频生成模型

3 个月前

SoundStorm 音频生成深度学习语音合成并行处理 Github 开源项目

3 个月前

相关项目

SoundStorm

SoundStorm是一个基于谷歌研究的并行音频生成项目的非官方PyTorch实现。该项目采用掩码离散扩散方法，使用HuBERT提取语义并预测声学特征。与原版不同，本实现创新性地使用浅层U-Net组合码本。项目提供完整的数据准备、训练和推理指南，为研究人员提供了探索并行音频生成技术的实用框架。

soundstorm-pytorch

SoundStorm是Google DeepMind开发的高效并行音频生成模型，本项目提供其PyTorch实现。该模型将MaskGiT技术应用于Soundstream的残差向量量化编码，采用Conformer架构。项目包含完整的训练和生成代码，支持原始音频处理和文本到语音转换。此实现整合了多个相关模型，旨在促进前沿语音合成技术的应用与研究。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com