表格类评价指标介绍
表格类任务分为表格预测和时序预测,其中表格预测任务采用表格分类算法。
时序预测
均方误差(Mean Square Error)
- 作用:
用于衡量回归模型的误差。
- 定义:
预测值和实际值的残差平方的均值。
- 计算过程:
- \[\text{MSE} = \frac{1}{N} \sum_{i=1}^{N} (y_i - y_{i}^{gt})^{2}\]
其中, \(y_i\) 是第 i 个样本的实际观测值, \(y_{i}^{gt}\) 是第 i 个样本的模型预测值, N 是样本数量。
平均绝对误差(Mean Absolute Error)
- 作用:
用于衡量回归模型的误差。
- 定义:
预测值和实际值的残差绝对值的均值。
- 计算过程:
- \[\text{MAE} = \frac{1}{N} \sum_{i=1}^{N} |y_i - y_{i}^{gt}|\]
其中, \(y_i\) 是第 i 个样本的实际观测值, \(y_{i}^{gt}\) 是第 i 个样本的模型预测值, N 是样本数量。
平均绝对百分比误差(Mean Absolute Percentage Error)
- 作用:
用于衡量回归模型的误差程度。
- 定义:
预测值和实际值的残差绝对值的百分比的均值。
- 计算过程:
- \[\text{MAPE} = \frac{1}{N} \sum_{i=1}^{N} \frac{(y_i - y_{i}^{gt})^{2}}{y_i}\]
其中, \(y_i\) 是第 i 个样本的实际观测值, \(y_{i}^{gt}\) 是第 i 个样本的模型预测值, N 是样本数量。
表格预测(二分类)
ROC 曲线(Receiver Operating Characteristic Curve)
- 作用:
用于衡量二分类模型的表现。
- 定义:
ROC曲线是以假正率(False Positive Rate,FPR)作为横轴,真正率(True Positive Rate,TPR,也称为召回率)作为纵轴所绘制的曲线。通常情况下,ROC 曲线越靠近左上角,表示模型性能越好。
- 计算过程:
根据模型预测结果以及真实标签,按照不同的分类阈值计算 TPR 和 FPR,然后在以 FPR 为横轴,TPR 为纵轴的坐标系上绘制 ROC 曲线。
AUC(Area Under the Curve)
- 作用:
用于衡量二分类模型的表现。
- 定义:
AUC 是 ROC 曲线(Receiver Operating Characteristic Curve)下的面积,AUC 取值越接近1表示模型的性能越好。
- 计算过程:
根据模型预测结果以及真实标签,按照不同的分类阈值计算 TPR 和 FPR ,然后在以 FPR 为横轴,TPR 为纵轴的坐标系上绘制 ROC 曲线。通过对 ROC 曲线下的面积进行积分计算得到 AUC 值。
P-R 曲线(Precision-Recall Curve)
- 作用:
用于衡量二分类模型的表现。
- 定义:
P-R 曲线以真正率(True Positive Rate,也称为召回率)作为横轴, 以精确率(Precision)为纵轴绘制的曲线。P-R 曲线上的每个点对应于模型在某个分类阈值下的精确率和召回率。通常情况下,P-R 曲线越靠近右上角(1,1),表示模型的性能越好,因为此时精确率高且召回率也高。
- 计算过程:
根据模型预测结果以及真实标签,按照不同的分类阈值计算召回率和精确率,然后在以召回率为横轴,精确率为纵轴的坐标系上绘制 P-R 曲线。