表格类评价指标介绍

表格类任务分为表格预测和时序预测,其中表格预测任务采用表格分类算法。

时序预测

均方误差(Mean Square Error)

作用:

用于衡量回归模型的误差。

定义:

预测值和实际值的残差平方的均值。

计算过程:
\[\text{MSE} = \frac{1}{N} \sum_{i=1}^{N} (y_i - y_{i}^{gt})^{2}\]

其中, \(y_i\) 是第 i 个样本的实际观测值, \(y_{i}^{gt}\) 是第 i 个样本的模型预测值, N 是样本数量。

平均绝对误差(Mean Absolute Error)

作用:

用于衡量回归模型的误差。

定义:

预测值和实际值的残差绝对值的均值。

计算过程:
\[\text{MAE} = \frac{1}{N} \sum_{i=1}^{N} |y_i - y_{i}^{gt}|\]

其中, \(y_i\) 是第 i 个样本的实际观测值, \(y_{i}^{gt}\) 是第 i 个样本的模型预测值, N 是样本数量。

平均绝对百分比误差(Mean Absolute Percentage Error)

作用:

用于衡量回归模型的误差程度。

定义:

预测值和实际值的残差绝对值的百分比的均值。

计算过程:
\[\text{MAPE} = \frac{1}{N} \sum_{i=1}^{N} \frac{(y_i - y_{i}^{gt})^{2}}{y_i}\]

其中, \(y_i\) 是第 i 个样本的实际观测值, \(y_{i}^{gt}\) 是第 i 个样本的模型预测值, N 是样本数量。

表格预测(二分类)

ROC 曲线(Receiver Operating Characteristic Curve)

作用:

用于衡量二分类模型的表现。

定义:

ROC曲线是以假正率(False Positive Rate,FPR)作为横轴,真正率(True Positive Rate,TPR,也称为召回率)作为纵轴所绘制的曲线。通常情况下,ROC 曲线越靠近左上角,表示模型性能越好。

计算过程:

根据模型预测结果以及真实标签,按照不同的分类阈值计算 TPR 和 FPR,然后在以 FPR 为横轴,TPR 为纵轴的坐标系上绘制 ROC 曲线。

AUC(Area Under the Curve)

作用:

用于衡量二分类模型的表现。

定义:

AUC 是 ROC 曲线(Receiver Operating Characteristic Curve)下的面积,AUC 取值越接近1表示模型的性能越好。

计算过程:

根据模型预测结果以及真实标签,按照不同的分类阈值计算 TPR 和 FPR ,然后在以 FPR 为横轴,TPR 为纵轴的坐标系上绘制 ROC 曲线。通过对 ROC 曲线下的面积进行积分计算得到 AUC 值。

P-R 曲线(Precision-Recall Curve)

作用:

用于衡量二分类模型的表现。

定义:

P-R 曲线以真正率(True Positive Rate,也称为召回率)作为横轴, 以精确率(Precision)为纵轴绘制的曲线。P-R 曲线上的每个点对应于模型在某个分类阈值下的精确率和召回率。通常情况下,P-R 曲线越靠近右上角(1,1),表示模型的性能越好,因为此时精确率高且召回率也高。

计算过程:

根据模型预测结果以及真实标签,按照不同的分类阈值计算召回率和精确率,然后在以召回率为横轴,精确率为纵轴的坐标系上绘制 P-R 曲线。