语音情感识别
本仓库包含我们使用emodb数据集进行语音情感识别的工作。该数据集可在此处获取 Emo-db
先决条件
Linux(最好是Ubuntu LTS)。Python2.x
安装依赖项
注意:如果您正在安装这些软件包,可以跳过此步骤。
依赖项列在下方和requirements.txt
文件中。
- h5py
- Keras
- scipy
- sklearn
- speechpy
- tensorflow
在您的发行版中安装一个Python包管理器。如果您安装了pip,则可以通过运行以下命令安装依赖项
pip3 install -r requirements.txt
如果您希望在GPU上加速keras训练,可以通过以下命令安装tensorflow-gpu
pip3 install tensorflow-gpu
目录结构
speechemotionrecognition/
- 包含与包对应的所有代码文件的包文件夹dataset/
- 包含wav格式的语音文件,分为7个文件夹,对应这些文件的标签models/
- 包含在测试数据上获得最佳准确率的已保存模型examples/
- 包含如何使用该包的示例
包的详细信息
utilities.py
- 包含读取文件、提取特征和创建测试和训练数据的代码mlmodel.py
- 训练非深度学习模型的代码。我们有三个模型1 - SVM
2 - 随机森林
3 - 神经网络
dnn.py
- 训练深度学习模型的代码。支持以下两个模型1 - CNN
2 - LSTM
示例
请查看examples/
目录。ml_example.py
包含使用机器学习模型的示例。
cnn_example.py
和lstm_example.py
包含使用CNN和LSTM模型的示例。
文档
代码文档可以在这里找到
安装
仓库中提供了一个setup.py
文件。您可以运行sudo python3 setup.py install
在系统级安装。
如果您没有权限这样做,可以通过运行python3 setup.py install --user
在用户级安装。
为仓库贡献
- 如果您发现代码有任何问题,请随时提出问题。
- 如果您发现可以改进的地方,请向我发送包含您的更改的拉取请求。 我将非常乐意审查和批准它们。
注意:如果您觉得这段代码有用,请留下一个星标 :)