AI人工智能 分类器的性能
在实现机器学习算法之后,我们需要找出模型的有效性。 衡量有效性的标准可以基于数据集和度量标准。 为了评估不同的机器学习算法,我们可以使用不同的性能指标。 例如,假设使用分类器来区分不同对象的图像,可以使用分类性能指标,如平均准确率,AUC 等。从某种意义上说,我们选择评估机器学习模型的指标是非常重要的,因为指标的选择会影响机器学习算法的性能如何被测量和比较。 以下是一些指标 -
混乱矩阵
基本上它用于输出可以是两种或更多种类的分类问题。 这是衡量分类器性能的最简单方法。 混淆矩阵基本上是一个包含两个维度即“实际”和“预测”的表格。 这两个维度都有“真正的正面(TP)”,“真正的负面(TN)”,“错误的正面(FP)”,“错误的否定(FN)”。
在上面的混淆矩阵中,1
表示正类,0
表示负类。
以下是与混淆矩阵相关的术语 -
- 真正 - 当实际的数据点类别为 1 并且预测也为 1 时,TP 就是这种情况。
- 真负 - 当数据点的实际类别为 0 并且预测也为 0 时,TN 就是这种情况。
- 假正 - 当实际的数据点类别为 0 并且预测也为 1 时,FP 就是这种情况。
- 假负 - FN 是数据点的实际类别为 1 且预测也为
0
的情况。
准确性
混淆矩阵本身并不是一个性能指标,但几乎所有的性能矩阵均基于混淆矩阵。 其中之一是准确性。 在分类问题中,它可能被定义为由模型对各种预测所做的正确预测的数量。 计算准确度的公式如下 -
精确 它主要用于文件检索。 它可能被定义为返回的文件有多少是正确的。 以下是计算精度的公式 -
召回或灵敏度 它可能被定义为模型返回的正数有多少。 以下是计算模型召回/灵敏度的公式 -
特异性 它可以定义为模型返回的负数有多少。 这与召回完全相反。 以下是计算模型特异性的公式 -