#MSP-Podcast

SER-Odyssey-Baseline-WavLM-Multi-Attributes - WavLM基线模型实现多维度语音情感分析

模型MSP-Podcast音频分类开源项目Huggingface语音情感识别多任务模型GithubWavLM

此模型是Odyssey 2024语音情感识别竞赛的基线系统，基于WavLM架构开发。它能够同时预测语音的唤醒度、支配度和效价三个维度，输出值范围在0到1之间。模型使用MSP-Podcast数据集训练，并在竞赛的Test3和Development数据集上完成了基准测试。该模型提供了简洁的使用接口，便于集成到各类语音情感分析应用中。

wav2vec2-large-robust-12-ft-emotion-msp-dim - 基于Wav2vec 2.0的多维语音情感识别模型

Wav2vec 2.0Huggingface模型语音情感识别音频分类Github开源项目神经网络模型MSP-Podcast

该模型基于Wav2vec 2.0技术，通过在MSP-Podcast数据集上微调Wav2Vec2-Large-Robust模型实现。它能够处理原始音频信号，识别语音中的唤醒度、支配度和效价三个维度，输出0-1范围内的情感预测结果。此外，模型还提供最后一个transformer层的池化状态，为语音情感分析研究提供了有力支持。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号