#EnCodec
audiolm-pytorch - 基于Pytorch的音频生成模型AudioLM
AudioLM音频生成PytorchSoundStreamEnCodecGithub开源项目
AudioLM是一个基于Pytorch的音频生成模型,具有T5引导的文本到音频转换功能。该项目还兼容SoundStream和Facebook的EnCodec,并提供了多个音频编码和解码模块。用户可以通过完整的训练和使用流程,包括SoundStream、分层Transformer和基于文本条件的音频合成,来进行音频生成技术的研究和开发。
encodec_24khz - Meta AI开发的神经网络音频编解码器
模型Github实时压缩开源项目高保真音频HuggingfaceMeta AIEnCodec神经网络音频编解码器
EnCodec是Meta AI开发的神经网络音频编解码器,采用流式编码器-解码器架构和量化潜在空间。它使用多尺度频谱图对抗性训练,有效减少伪影,产生高质量音频样本。EnCodec在不同带宽下性能优异,适用于实时音频压缩、解码和各种音频处理应用。