#跨模态学习

DiffGesture: 利用扩散模型实现音频驱动的协同语音手势生成

2024年09月05日
Cover of DiffGesture: 利用扩散模型实现音频驱动的协同语音手势生成

LLM-Codec: 革命性的大语言模型驱动音频编解码器

2024年09月04日
Cover of LLM-Codec: 革命性的大语言模型驱动音频编解码器