PyCM 项目介绍
PyCM 是一个用 Python 编写的多类别混淆矩阵库,它是一个数据科学家在使用预测模型进行分类后评估的多功能工具。这个库支持输入数据向量和直接矩阵形式,是用于评估大多数分类器的广泛统计参数的理想选择。
特色
- 多类别支持:PyCM 旨在支持多类别的混淆矩阵,这使得它非常适合用于处理复杂分类任务的数据科学项目。
- 丰富的统计参数:它能够计算大多数类的统计参数,如准确率、精确率、召回率等,为模型评估提供了强有力的支持。
- 灵活的数据输入方式:支持直接输入数据向量或者使用已经计算好的混淆矩阵。
安装指南
PyCM 可以通过多种方式进行安装:
- 使用 PyPI: 用户可以运行命令
pip install pycm==4.1
来进行安装。 - 源码安装: 可以下载版本 4.1或最新源码,然后运行
pip install .
。 - Conda 方式: 首先更新 conda,然后使用
conda install -c sepandhaghighi pycm
命令安装。
使用方法
基于向量的使用
用户可以通过向量定义实际和预测值,进而生成混淆矩阵。例如:
from pycm import *
y_actu = [2, 0, 2, 2, 0, 1, 1, 2, 2, 0, 1, 2]
y_pred = [0, 0, 2, 1, 0, 2, 1, 0, 2, 0, 2, 2]
cm = ConfusionMatrix(actual_vector=y_actu, predict_vector=y_pred)
cm.print_matrix()
cm.stat(summary=True)
直接矩阵输入
用户还可以通过直接提供混淆矩阵数据结构的方法来使用 PyCM:
from pycm import *
cm2 = ConfusionMatrix(matrix={"Class1": {"Class1": 1, "Class2": 2}, "Class2": {"Class1": 0, "Class2": 5}})
cm2.print_matrix()
cm2.stat(summary=True)
可视化功能
从版本 3.0 开始,PyCM 提供了一个 plot
方法,允许用户使用 Matplotlib 或 Seaborn 绘制混淆矩阵:
cm.plot()
高级功能
PyCM 提供了高级功能,如 ROC 曲线、精确 - 召回曲线计算、参数推荐及多标签混淆矩阵支持,帮助用户更全面深刻地分析模型的能力。
支持与反馈
如果您在使用中遇到任何问题,可以通过以下方式获取帮助:
- 在 GitHub 上提交问题
- 加入 PyCM 的 Discord 社区
- 访问 PyCM 网站
- 通过电子邮件发送问题
在使用 PyCM 的过程中,您会发现这是一个强大而灵活的工具,尤其适用于需要评估复杂多类别分类器的项目。无论是简单的项目,还是需要进行高级分析的复杂任务,PyCM 都能够帮助您得到精准的结果。