#EnCodec

audiolm-pytorch - 基于Pytorch的音频生成模型AudioLM

AudioLM音频生成PytorchSoundStreamEnCodecGithub开源项目

AudioLM是一个基于Pytorch的音频生成模型，具有T5引导的文本到音频转换功能。该项目还兼容SoundStream和Facebook的EnCodec，并提供了多个音频编码和解码模块。用户可以通过完整的训练和使用流程，包括SoundStream、分层Transformer和基于文本条件的音频合成，来进行音频生成技术的研究和开发。

encodec_24khz - Meta AI开发的神经网络音频编解码器

模型Github实时压缩开源项目高保真音频HuggingfaceMeta AIEnCodec神经网络音频编解码器

EnCodec是Meta AI开发的神经网络音频编解码器，采用流式编码器-解码器架构和量化潜在空间。它使用多尺度频谱图对抗性训练，有效减少伪影，产生高质量音频样本。EnCodec在不同带宽下性能优异，适用于实时音频压缩、解码和各种音频处理应用。

相关文章

Article Cover

AudioLM-PyTorch: 革命性的音频生成语言模型

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号