#音频压缩

AcademiCodec - 开源音频编解码工具包推动学术创新
AcademiCodec音频编解码开源工具包AI模型音频压缩Github开源项目
AcademiCodec是首个开源音频编解码工具包,包含EnCodec、SoundStream和HiFi-Codec等模型的训练代码和预训练模型。其创新的群组残差向量量化(GRVQ)技术实现了仅需4个码本的高保真音频编解码器HiFi-Codec。该项目利用超过1000小时的公开TTS数据训练,旨在促进音频编解码和生成领域的学术研究与应用开发。
snac - 多尺度神经音频编解码器实现低比特率音频压缩
SNAC音频压缩神经网络编解码器分层令牌低比特率Github开源项目
SNAC是一种多尺度神经音频编解码器,能将音频压缩为低比特率的离散编码。它使用分层令牌编码方法,通过降低粗糙令牌的采样频率来覆盖更长时间跨度,有效节省比特率并支持长时间音频建模。SNAC提供多个预训练模型,适用于语音和音乐等场景,采样率覆盖24kHz至44kHz。开发者可使用Python简单实现音频编码和解码。
react-native-compressor - React Native多媒体文件压缩库
React Native媒体压缩图片压缩视频压缩音频压缩Github开源项目
react-native-compressor是一个轻量级React Native库,可高效压缩图片、视频和音频文件。支持自动和手动压缩,提供后台上传、文件下载和视频缩略图生成功能。该库仅增加50KB APK大小,远小于FFmpeg,无需了解复杂压缩算法即可轻松使用。
snac_44khz - 多尺度神经音频编解码器实现低比特率音频压缩
Huggingface模型SNACGithub低比特率神经音频编解码器音乐生成开源项目音频压缩
SNAC(Multi-Scale Neural Audio Codec)是一种创新的音频压缩模型,采用分层令牌方法将44kHz音频压缩至2.6kbps的低比特率。该模型引入粗糙令牌的低频采样机制,优化了音频编码效果。SNAC主要针对音乐数据训练,适用于音乐和音效处理。它提供多个预训练模型,支持不同采样率和比特率,便于在Python项目中进行音频编码和解码。SNAC在保持音质的同时,实现了高效的音频压缩,为音频处理领域提供了新的解决方案。
snac_24khz - 高效低比特率音频压缩的神经编解码器
模型音频压缩语音合成GithubSNAC深度学习神经网络编解码器Huggingface开源项目
SNAC是一种先进的多尺度神经音频编解码器,以0.98 kbps的超低比特率压缩24 kHz音频。它采用分层令牌方法,创新地降低了粗糙令牌的采样频率,扩大时间覆盖范围。该模型主要用于语音合成,但也提供适用于音乐和音效的高采样率版本。SNAC支持单声道音频处理,提供多个预训练模型以满足不同需求,是音频压缩和处理领域的重要工具。