#音频压缩

AcademiCodec - 开源音频编解码工具包推动学术创新

AcademiCodec音频编解码开源工具包AI模型音频压缩Github开源项目

AcademiCodec是首个开源音频编解码工具包，包含EnCodec、SoundStream和HiFi-Codec等模型的训练代码和预训练模型。其创新的群组残差向量量化(GRVQ)技术实现了仅需4个码本的高保真音频编解码器HiFi-Codec。该项目利用超过1000小时的公开TTS数据训练，旨在促进音频编解码和生成领域的学术研究与应用开发。

snac - 多尺度神经音频编解码器实现低比特率音频压缩

SNAC音频压缩神经网络编解码器分层令牌低比特率Github开源项目

SNAC是一种多尺度神经音频编解码器，能将音频压缩为低比特率的离散编码。它使用分层令牌编码方法，通过降低粗糙令牌的采样频率来覆盖更长时间跨度，有效节省比特率并支持长时间音频建模。SNAC提供多个预训练模型，适用于语音和音乐等场景，采样率覆盖24kHz至44kHz。开发者可使用Python简单实现音频编码和解码。

react-native-compressor - React Native多媒体文件压缩库

React Native媒体压缩图片压缩视频压缩音频压缩Github开源项目

react-native-compressor是一个轻量级React Native库,可高效压缩图片、视频和音频文件。支持自动和手动压缩,提供后台上传、文件下载和视频缩略图生成功能。该库仅增加50KB APK大小,远小于FFmpeg,无需了解复杂压缩算法即可轻松使用。

snac_44khz - 多尺度神经音频编解码器实现低比特率音频压缩

Huggingface模型SNACGithub低比特率神经音频编解码器音乐生成开源项目音频压缩

SNAC(Multi-Scale Neural Audio Codec)是一种创新的音频压缩模型，采用分层令牌方法将44kHz音频压缩至2.6kbps的低比特率。该模型引入粗糙令牌的低频采样机制，优化了音频编码效果。SNAC主要针对音乐数据训练，适用于音乐和音效处理。它提供多个预训练模型，支持不同采样率和比特率，便于在Python项目中进行音频编码和解码。SNAC在保持音质的同时，实现了高效的音频压缩，为音频处理领域提供了新的解决方案。

snac_24khz - 高效低比特率音频压缩的神经编解码器

模型音频压缩语音合成GithubSNAC深度学习神经网络编解码器Huggingface开源项目

SNAC是一种先进的多尺度神经音频编解码器，以0.98 kbps的超低比特率压缩24 kHz音频。它采用分层令牌方法，创新地降低了粗糙令牌的采样频率，扩大时间覆盖范围。该模型主要用于语音合成，但也提供适用于音乐和音效的高采样率版本。SNAC支持单声道音频处理，提供多个预训练模型以满足不同需求，是音频压缩和处理领域的重要工具。

相关文章

Article Cover

AcademiCodec: 开源音频编解码模型助力学术研究

Article Cover

SNAC: 突破性的神经网络音频压缩技术

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号