#跨模态学习

DiffGesture: 利用扩散模型实现音频驱动的协同语音手势生成

3 个月前
Cover of DiffGesture: 利用扩散模型实现音频驱动的协同语音手势生成

LLM-Codec: 革命性的大语言模型驱动音频编解码器

3 个月前
Cover of LLM-Codec: 革命性的大语言模型驱动音频编解码器