#音频编解码

SemantiCodec: 一种超低比特率的语义音频编解码器

3 个月前

SemantiCodec 音频编解码低比特率语义空间神经网络 Github 开源项目

3 个月前

encodec.cpp: Meta的Encodec音频编解码器的C/C++高性能实现

3 个月前

Encodec 音频编解码深度学习 GGML GPU加速 Github 开源项目

3 个月前

Codec-SUPERB:一个全面评估音频编解码模型的创新基准测试平台

3 个月前

Codec-SUPERB 语音处理性能基准音频编解码评估框架 Github 开源项目

3 个月前

AcademiCodec: 开源音频编解码模型助力学术研究

3 个月前

AcademiCodec 音频编解码开源工具包 AI模型音频压缩 Github 开源项目

3 个月前

相关项目

AcademiCodec

AcademiCodec是首个开源音频编解码工具包，包含EnCodec、SoundStream和HiFi-Codec等模型的训练代码和预训练模型。其创新的群组残差向量量化(GRVQ)技术实现了仅需4个码本的高保真音频编解码器HiFi-Codec。该项目利用超过1000小时的公开TTS数据训练，旨在促进音频编解码和生成领域的学术研究与应用开发。

Codec-SUPERB

Codec-SUPERB是一个综合性音频编解码模型评估平台，提供标准化测试环境和统一数据集。平台特色包括直观的编解码接口、多角度评估和在线排行榜。它旨在促进语音处理领域的发展，为研究人员提供便捷的模型集成和测试环境，支持快速迭代和实验。

encodec.cpp

encodec.cpp是Meta's Encodec深度学习音频编解码器模型的C/C++实现。该项目基于ggml库开发，无需其他依赖。支持24KHz模型、混合F16/F32精度，并可通过Metal和cuBLAS进行加速。项目提供C风格API和使用示例，正在开发4位和8位量化功能。encodec.cpp为音频编解码任务提供了高性能、易用的开源解决方案。

SemantiCodec-inference

SemantiCodec是一个开源的神经音频编解码器项目，提供0.31-1.40 kbps的超低比特率音频压缩。通过优化潜在空间的语义表示，实现高效的音频编码和解码。支持25-100每秒的灵活令牌率，兼容CPU、CUDA和MPS平台。项目提供简单的API接口，适用于需要高压缩率同时保持音质的应用场景。

encodec_32khz

EnCodec 32kHz是Meta AI研发的实时音频编解码器，采用神经网络和量化潜在空间的流式架构。该模型通过多尺度频谱图对抗机制提升音频质量，支持多种采样率和带宽设置。EnCodec不仅可独立用于音频压缩，还能与MusicGen模型结合进行音乐生成，体现了在音频处理领域的广泛应用潜力。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com