#神经音频编解码器
AudioDec - 流式高保真神经音频编解码开源项目
AudioDec神经音频编解码器流式传输高保真开源Github开源项目
AudioDec项目开发了一种流式高保真神经音频编解码器,可以12.8 kbps的比特率处理48 kHz单声道语音。该编解码器在GPU上解码延迟约6毫秒,CPU上约10毫秒。项目采用两阶段训练方法,利用预训练模型可快速为新应用训练编码器。AudioDec在压缩率、延迟和重建质量方面均表现优异,适用于实时通信等场景。
snac_44khz - 多尺度神经音频编解码器实现低比特率音频压缩
Huggingface模型SNACGithub低比特率神经音频编解码器音乐生成开源项目音频压缩
SNAC(Multi-Scale Neural Audio Codec)是一种创新的音频压缩模型,采用分层令牌方法将44kHz音频压缩至2.6kbps的低比特率。该模型引入粗糙令牌的低频采样机制,优化了音频编码效果。SNAC主要针对音乐数据训练,适用于音乐和音效处理。它提供多个预训练模型,支持不同采样率和比特率,便于在Python项目中进行音频编码和解码。SNAC在保持音质的同时,实现了高效的音频压缩,为音频处理领域提供了新的解决方案。