#MSP-Podcast
SER-Odyssey-Baseline-WavLM-Multi-Attributes - WavLM基线模型实现多维度语音情感分析
模型MSP-Podcast音频分类开源项目Huggingface语音情感识别多任务模型GithubWavLM
此模型是Odyssey 2024语音情感识别竞赛的基线系统,基于WavLM架构开发。它能够同时预测语音的唤醒度、支配度和效价三个维度,输出值范围在0到1之间。模型使用MSP-Podcast数据集训练,并在竞赛的Test3和Development数据集上完成了基准测试。该模型提供了简洁的使用接口,便于集成到各类语音情感分析应用中。
wav2vec2-large-robust-12-ft-emotion-msp-dim - 基于Wav2vec 2.0的多维语音情感识别模型
Wav2vec 2.0Huggingface模型语音情感识别音频分类Github开源项目神经网络模型MSP-Podcast
该模型基于Wav2vec 2.0技术,通过在MSP-Podcast数据集上微调Wav2Vec2-Large-Robust模型实现。它能够处理原始音频信号,识别语音中的唤醒度、支配度和效价三个维度,输出0-1范围内的情感预测结果。此外,模型还提供最后一个transformer层的池化状态,为语音情感分析研究提供了有力支持。