UniCATS-CTX-vec2wav
UniCATS-CTX-vec2wav是UniCATS框架中的声学上下文感知声码器。该项目利用上下文VQ-Diffusion和声码化技术进行语音合成,提供完整的训练和推理流程。支持多GPU训练,并提供16kHz和24kHz采样率的预训练模型参数。此开源项目为研究人员和开发者提供了探索先进语音合成技术的平台。