TabularPredictor.save_space¶
- TabularPredictor.save_space(remove_data=True, remove_fit_stack=True, requires_save=True, reduce_children=False)[source]¶
通过删除不需要用于新数据预测的辅助模型文件,减少预测器的内存和磁盘占用。 此函数对推理准确性没有影响。 如果唯一目标是使用训练好的模型进行预测,建议调用此方法。 然而,在调用save_space()后,某些高级功能可能不再可用。
- Parameters:
remove_data (bool, default = True) –
是否移除原始训练和验证数据的缓存文件。 仅减少磁盘使用,对内存使用没有影响。 这在原始数据较大时特别有用。 这相当于在原始fit()期间设置cache_data=False。
将禁用所有需要cache_data=True的高级功能。
remove_fit_stack (bool, default = True) –
是否移除拟合新堆叠模型所需的信息,并继续使用新折拟合袋装模型。 仅减少磁盘使用量,对内存使用量没有影响。 这包括:
折外(OOF)预测
这对于具有许多类别的多类问题非常有用,因为OOF预测在磁盘上可能变得非常大。(在极端情况下,每个模型1 GB) 这将禁用堆叠模型的predictor.refit_full()。
requires_save (bool, default = True) –
是否移除需要模型再次保存到磁盘的信息。 通常这仅包括对内存或磁盘使用没有显著影响的标志变量,但由于移除了更重要的信息,技术上应该更新这些变量。
一个例子是trainer中的is_data_saved布尔变量,如果设置了remove_data=True,则应将其更新为False。
reduce_children (bool, default = False) – 是否将减少规则应用于袋装集成子模型。这些模型是为袋装集成的每个折叠训练的。 通常应保持为False,因为在原始fit()调用期间,最重要的内存和磁盘减少技术会自动应用于这些模型。