#音频编解码

SemantiCodec: 一种超低比特率的语义音频编解码器

3 个月前
Cover of SemantiCodec: 一种超低比特率的语义音频编解码器

encodec.cpp: Meta的Encodec音频编解码器的C/C++高性能实现

3 个月前
Cover of encodec.cpp: Meta的Encodec音频编解码器的C/C++高性能实现

Codec-SUPERB:一个全面评估音频编解码模型的创新基准测试平台

3 个月前
Cover of Codec-SUPERB:一个全面评估音频编解码模型的创新基准测试平台

AcademiCodec: 开源音频编解码模型助力学术研究

3 个月前
Cover of AcademiCodec: 开源音频编解码模型助力学术研究
相关项目
Project Cover

AcademiCodec

AcademiCodec是首个开源音频编解码工具包,包含EnCodec、SoundStream和HiFi-Codec等模型的训练代码和预训练模型。其创新的群组残差向量量化(GRVQ)技术实现了仅需4个码本的高保真音频编解码器HiFi-Codec。该项目利用超过1000小时的公开TTS数据训练,旨在促进音频编解码和生成领域的学术研究与应用开发。

Project Cover

Codec-SUPERB

Codec-SUPERB是一个综合性音频编解码模型评估平台,提供标准化测试环境和统一数据集。平台特色包括直观的编解码接口、多角度评估和在线排行榜。它旨在促进语音处理领域的发展,为研究人员提供便捷的模型集成和测试环境,支持快速迭代和实验。

Project Cover

encodec.cpp

encodec.cpp是Meta's Encodec深度学习音频编解码器模型的C/C++实现。该项目基于ggml库开发,无需其他依赖。支持24KHz模型、混合F16/F32精度,并可通过Metal和cuBLAS进行加速。项目提供C风格API和使用示例,正在开发4位和8位量化功能。encodec.cpp为音频编解码任务提供了高性能、易用的开源解决方案。

Project Cover

SemantiCodec-inference

SemantiCodec是一个开源的神经音频编解码器项目,提供0.31-1.40 kbps的超低比特率音频压缩。通过优化潜在空间的语义表示,实现高效的音频编码和解码。支持25-100每秒的灵活令牌率,兼容CPU、CUDA和MPS平台。项目提供简单的API接口,适用于需要高压缩率同时保持音质的应用场景。

Project Cover

encodec_32khz

EnCodec 32kHz是Meta AI研发的实时音频编解码器,采用神经网络和量化潜在空间的流式架构。该模型通过多尺度频谱图对抗机制提升音频质量,支持多种采样率和带宽设置。EnCodec不仅可独立用于音频压缩,还能与MusicGen模型结合进行音乐生成,体现了在音频处理领域的广泛应用潜力。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号