#低比特率
相关项目
snac
SNAC是一种多尺度神经音频编解码器,能将音频压缩为低比特率的离散编码。它使用分层令牌编码方法,通过降低粗糙令牌的采样频率来覆盖更长时间跨度,有效节省比特率并支持长时间音频建模。SNAC提供多个预训练模型,适用于语音和音乐等场景,采样率覆盖24kHz至44kHz。开发者可使用Python简单实现音频编码和解码。
SemantiCodec-inference
SemantiCodec是一个开源的神经音频编解码器项目,提供0.31-1.40 kbps的超低比特率音频压缩。通过优化潜在空间的语义表示,实现高效的音频编码和解码。支持25-100每秒的灵活令牌率,兼容CPU、CUDA和MPS平台。项目提供简单的API接口,适用于需要高压缩率同时保持音质的应用场景。
snac_44khz
SNAC(Multi-Scale Neural Audio Codec)是一种创新的音频压缩模型,采用分层令牌方法将44kHz音频压缩至2.6kbps的低比特率。该模型引入粗糙令牌的低频采样机制,优化了音频编码效果。SNAC主要针对音乐数据训练,适用于音乐和音效处理。它提供多个预训练模型,支持不同采样率和比特率,便于在Python项目中进行音频编码和解码。SNAC在保持音质的同时,实现了高效的音频压缩,为音频处理领域提供了新的解决方案。