TabularPredictor.load_data_internal

TabularPredictor.load_data_internal(data='train', return_X=True, return_y=True)[source]

加载模型训练期间使用的内部数据表示。 像神经网络这样的单个AutoGluon模型可能会应用此方法中未反映的额外特征转换。 此方法仅应用所有AutoGluon模型采用的通用转换。 警告,内部表示可能:

与原始数据相比具有不同的特征。 与原始数据相比具有不同的行数。 具有与原始数据不对齐的索引。 具有与原始数据中不同的标签值。

内部数据表示不应与原始数据结合,在大多数情况下这是不可能的。

Parameters:
  • data (str, default = 'train') –

    要加载的数据。 有效值为:

    ’train’:

    加载模型训练期间使用的训练数据。 这是传递给fit()train_data的转换和增强版本。

    ’val’:

    加载模型训练期间使用的验证数据。 这是传递给fit()tuning_data的转换和增强版本。 如果在fit()中设置了tuning_data=None,则tuning_data是通过拆分train_data自动生成的验证集。 警告:如果由袋装预测器调用,将引发异常,因为袋装预测器没有验证数据。

  • return_X (bool, default = True) – 是否返回内部数据特征 如果设置为 False,则返回的元组中的第一个元素将为 None。

  • return_y (bool, default = True) – 是否返回内部数据标签 如果设置为False,则返回的元组中的第二个元素将为None。

Return type:

元组 (pd.DataFrame, pd.Series) 分别对应于内部数据特征和内部数据标签。