TimeSeriesDataFrame.fill_missing_values

TimeSeriesDataFrame.fill_missing_values(method: str = 'auto', value: float = 0.0) TimeSeriesDataFrame[source]

填充由NaN表示的缺失值。

Parameters:
  • method (str, default = "auto") –

    用于填补缺失值的方法。

    • ”auto” - 首先向前填充(以填补中间和尾部的NaN),然后向后填充(以填补前导的NaN)

    • ”ffill” 或 “pad” - 将最后一个有效观测值向前传播。注意:时间序列开始时的缺失值不会被填补。

    • ”bfill” 或 “backfill” - 使用下一个有效观测值来填补空缺。注意:这可能导致信息泄露;时间序列结束时的缺失值不会被填补。

    • ”constant” - 用给定的常数 value 替换NaN。

    • ”interpolate” - 使用线性插值填补NaN值。注意:这可能导致信息泄露。

  • value (float, default = 0.0) – 用于“constant”插补方法的值。

示例

>>> ts_df
                    target
item_id timestamp
0       2019-01-01     NaN
        2019-01-02     NaN
        2019-01-03     1.0
        2019-01-04     NaN
        2019-01-05     NaN
        2019-01-06     2.0
        2019-01-07     NaN
1       2019-02-04     NaN
        2019-02-05     3.0
        2019-02-06     NaN
        2019-02-07     4.0
>>> ts_df.fill_missing_values(method="auto")
                    target
item_id timestamp
0       2019-01-01     1.0
        2019-01-02     1.0
        2019-01-03     1.0
        2019-01-04     1.0
        2019-01-05     1.0
        2019-01-06     2.0
        2019-01-07     2.0
1       2019-02-04     3.0
        2019-02-05     3.0
        2019-02-06     3.0
        2019-02-07     4.0