TimeSeriesDataFrame.train_test_split

TimeSeriesDataFrame.train_test_split(prediction_length: int, end_index: int | None = None, suffix: str | None = None) Tuple[TimeSeriesDataFrame, TimeSeriesDataFrame][source]

从给定的数据集中生成训练/测试分割。 此方法可用于生成多窗口回测的分割。

Parameters:
  • prediction_length (int) – 单个评估窗口中的时间步数。

  • end_index (int, optional) – 如果给定,所有时间序列将在训练/测试分割之前缩短到 end_idx。换句话说,测试数据将包括每个时间序列的切片 [:end_index],而训练数据将包括切片 [:end_index - prediction_length]

  • suffix (str, optional) – 后缀附加到item_id索引级别中的所有条目。

Returns:

  • train_data (TimeSeriesDataFrame) – 数据的训练部分。包含test_data中每个时间序列的[:-prediction_length]切片。

  • test_data (TimeSeriesDataFrame) – 数据的测试部分。包含原始数据集中每个时间序列的[:end_idx]切片。