TimeSeriesDataFrame.fill_missing_values¶
- TimeSeriesDataFrame.fill_missing_values(method: str = 'auto', value: float = 0.0) TimeSeriesDataFrame[source]¶
填充由NaN表示的缺失值。
- Parameters:
method (str, default = "auto") –
用于填补缺失值的方法。
”auto” - 首先向前填充(以填补中间和尾部的NaN),然后向后填充(以填补前导的NaN)
”ffill” 或 “pad” - 将最后一个有效观测值向前传播。注意:时间序列开始时的缺失值不会被填补。
”bfill” 或 “backfill” - 使用下一个有效观测值来填补空缺。注意:这可能导致信息泄露;时间序列结束时的缺失值不会被填补。
”constant” - 用给定的常数
value替换NaN。”interpolate” - 使用线性插值填补NaN值。注意:这可能导致信息泄露。
value (float, default = 0.0) – 用于“constant”插补方法的值。
示例
>>> ts_df target item_id timestamp 0 2019-01-01 NaN 2019-01-02 NaN 2019-01-03 1.0 2019-01-04 NaN 2019-01-05 NaN 2019-01-06 2.0 2019-01-07 NaN 1 2019-02-04 NaN 2019-02-05 3.0 2019-02-06 NaN 2019-02-07 4.0
>>> ts_df.fill_missing_values(method="auto") target item_id timestamp 0 2019-01-01 1.0 2019-01-02 1.0 2019-01-03 1.0 2019-01-04 1.0 2019-01-05 1.0 2019-01-06 2.0 2019-01-07 2.0 1 2019-02-04 3.0 2019-02-05 3.0 2019-02-06 3.0 2019-02-07 4.0