中位数平方误差#
- median_squared_error(y_true, y_pred, horizon_weight=None, multioutput='uniform_average', square_root=False, **kwargs)[源代码][源代码]#
中位数平方误差 (MdSE) 或根中位数平方误差 (RMdSE)。
如果
square_root为 False,则计算 MdSE;如果square_root为 True,则计算 RMdSE。MdSE 和 RMdSE 都返回非负浮点数。最佳值为 0.0。与MSE类似,MdSE以输入数据的平方单位进行测量。RMdSE与输入数据在同一尺度上,类似于RMSE。因为MdSE和RMdSE对预测误差进行平方而不是取绝对值,所以它们对大误差的惩罚比MAE或MdAE更重。
采用平方误差的中间值而不是平均值,使得这种度量相对于基于平均值的度量对误差异常值更为稳健,因为在存在异常值的情况下,中位数往往是中心趋势的更稳健的度量。
- 参数:
- y_truepd.Series, pd.DataFrame 或形状为 (fh,) 或 (fh, n_outputs) 的 np.array,其中 fh 是预测范围
地面实况(正确)的目标值。
- y_predpd.Series, pd.DataFrame 或形状为 (fh,) 或 (fh, n_outputs) 的 np.array,其中 fh 是预测范围
预测值。
- horizon_weight形状为 (fh,) 的类数组,默认=None
预测范围权重。
- 多输出{‘raw_values’, ‘uniform_average’} 或形状为 (n_outputs,) 的类数组,默认=’uniform_average’
定义如何聚合多变量(多输出)数据的度量。如果是类数组,则使用这些值作为权重来平均误差。如果是’raw_values’,则在多输出输入的情况下返回所有误差的完整集合。如果是’uniform_average’,则所有输出的误差以均匀权重平均。
- 平方根bool, 默认=False
是否取均方误差的平方根。如果为 True,则返回均方根误差(RMSE);如果为 False,则返回均方误差(MSE)。
- 返回:
- 损失浮动
MdSE 损失。如果 multioutput 是 ‘raw_values’,则分别返回每个输出的 MdSE。如果 multioutput 是 ‘uniform_average’ 或一个权重 ndarray,则返回所有输出误差的加权平均 MdSE。
参见
参考文献
Hyndman, R. J 和 Koehler, A. B. (2006)。“再论预测准确性的度量”,《国际预测杂志》,第22卷,第4期。
示例
>>> from sktime.performance_metrics.forecasting import median_squared_error >>> y_true = np.array([3, -0.5, 2, 7, 2]) >>> y_pred = np.array([2.5, 0.0, 2, 8, 1.25]) >>> median_squared_error(y_true, y_pred) 0.25 >>> median_squared_error(y_true, y_pred, square_root=True) 0.5 >>> y_true = np.array([[0.5, 1], [-1, 1], [7, -6]]) >>> y_pred = np.array([[0, 2], [-1, 2], [8, -5]]) >>> median_squared_error(y_true, y_pred) 0.625 >>> median_squared_error(y_true, y_pred, square_root=True) 0.75 >>> median_squared_error(y_true, y_pred, multioutput='raw_values') array([0.25, 1. ]) >>> median_squared_error(y_true, y_pred, multioutput='raw_values', square_root=True) array([0.5, 1. ]) >>> median_squared_error(y_true, y_pred, multioutput=[0.3, 0.7]) 0.7749999999999999 >>> median_squared_error(y_true, y_pred, multioutput=[0.3, 0.7], square_root=True) 0.85