TabularPredictor.disk_usage_per_file

TabularPredictor.disk_usage_per_file(*, sort_by: str = 'size', include_path_in_name: bool = False) Series[source]

返回predictor.path目录下每个文件的大小,单位为字节。

Parameters:
  • sort_by (str, default = "size") – 如果为None,输出文件将根据os.walk(path)中的搜索顺序排序。 如果为“size”,输出文件将按文件大小降序排列。 如果为“name”,输出文件将按名称升序排列。

  • include_path_in_name (bool, default = False) –

    如果为True,则在输出的pd.Series的索引中包含文件的完整路径,包括输入的path。 如果为False,则在输出的pd.Series的索引中移除文件路径的path前缀。

    例如,对于位于foo/bar/model.pkl的文件,path=’foo/’

    如果为True,索引将为foo/bar/model.pkl 如果为False,索引将为bar/model.pkl

Return type:

带有索引文件路径和值文件大小(以字节为单位)的pd.Series。