TimeSeriesDataFrame.train_test_split¶
- TimeSeriesDataFrame.train_test_split(prediction_length: int, end_index: int | None = None, suffix: str | None = None) Tuple[TimeSeriesDataFrame, TimeSeriesDataFrame][source]¶
从给定的数据集中生成训练/测试分割。 此方法可用于生成多窗口回测的分割。
- Parameters:
prediction_length (int) – 单个评估窗口中的时间步数。
end_index (int, optional) – 如果给定,所有时间序列将在训练/测试分割之前缩短到
end_idx。换句话说,测试数据将包括每个时间序列的切片[:end_index],而训练数据将包括切片[:end_index - prediction_length]。suffix (str, optional) – 后缀附加到
item_id索引级别中的所有条目。
- Returns:
train_data (TimeSeriesDataFrame) – 数据的训练部分。包含
test_data中每个时间序列的[:-prediction_length]切片。test_data (TimeSeriesDataFrame) – 数据的测试部分。包含原始数据集中每个时间序列的
[:end_idx]切片。