中位绝对标度误差#

median_absolute_scaled_error(y_true, y_pred, sp=1, horizon_weight=None, multioutput='uniform_average', **kwargs)[源代码][源代码]#

中位数绝对比例误差 (MdASE)。

MdASE 输出是非负浮点数。最佳值为 0.0。

采用测试和训练绝对误差的中位数而不是平均值,使得这一指标对误差异常值更具鲁棒性,因为中位数在存在异常值的情况下往往是更稳健的中心趋势度量。

与 MASE 和其他缩放性能指标类似,这种无尺度的指标可以用于在单一系列或系列之间比较预测方法。

与MASE类似,该指标非常适合间歇性需求序列,因为它不会给出无限或未定义的值,除非训练数据是一个平稳的时间序列。在这种情况下,函数返回一个较大的值而不是inf。

适用于具有相同季节性周期的多输出(多变量)时间序列数据。

参数:
y_truepd.Series, pd.DataFrame 或形状为 (fh,) 或 (fh, n_outputs) 的 np.array,其中 fh 是预测范围

地面真值(正确的)目标值。

y_predpd.Series, pd.DataFrame 或形状为 (fh,) 或 (fh, n_outputs) 的 np.array,其中 fh 是预测范围

预测值。

y_trainpd.Series, pd.DataFrame 或 np.array,形状为 (n_timepoints,) 或 (n_timepoints, n_outputs),默认 = None

观察到的训练值。

sp整数

训练数据的季节性周期。

horizon_weight形状为 (fh,) 的类数组,默认=None

预测范围权重。

多输出{‘raw_values’, ‘uniform_average’} 或形状为 (n_outputs,) 的类数组对象,默认=’uniform_average’

定义如何聚合多元(多输出)数据的度量。如果是类数组,则使用这些值作为权重来平均误差。如果是’raw_values’,则在多输出输入的情况下返回所有误差的完整集合。如果是’uniform_average’,则所有输出的误差以均匀权重平均。

返回:
损失浮点数或浮点数的ndarray

MdASE 损失。如果 multioutput 是 ‘raw_values’,则分别返回每个输出的 MdASE。如果 multioutput 是 ‘uniform_average’ 或一个权重 ndarray,则返回所有输出误差的加权平均 MdASE。

参见

mean_absolute_scaled_error
mean_squared_scaled_error
中位数平方缩放误差

参考文献

Hyndman, R. J 和 Koehler, A. B. (2006)。《另一种预测准确度量方法》,《国际预测杂志》,第22卷,第4期。

Hyndman, R. J. (2006). “对间歇性需求预测准确度量标准的另一种看法”, Foresight, 第4期。

Makridakis, S., Spiliotis, E. 和 Assimakopoulos, V. (2020) “M4 竞赛:100,000 个时间序列和 61 种预测方法”, 《国际预测杂志》, 第 3 卷。

示例

>>> from sktime.performance_metrics.forecasting import median_absolute_scaled_error
>>> y_train = np.array([5, 0.5, 4, 6, 3, 5, 2])
>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> median_absolute_scaled_error(y_true, y_pred, y_train=y_train)
0.16666666666666666
>>> y_train = np.array([[0.5, 1], [-1, 1], [7, -6]])
>>> y_true = np.array([[0.5, 1], [-1, 1], [7, -6]])
>>> y_pred = np.array([[0, 2], [-1, 2], [8, -5]])
>>> median_absolute_scaled_error(y_true, y_pred, y_train=y_train)
0.18181818181818182
>>> median_absolute_scaled_error(y_true, y_pred, y_train=y_train,     multioutput='raw_values')
array([0.10526316, 0.28571429])
>>> median_absolute_scaled_error( y_true, y_pred, y_train=y_train,     multioutput=[0.3, 0.7])
0.21935483870967742