Shortcuts

torcharrow.DataFrame.describe

DataFrame.describe(percentiles=None, include=None, exclude=None)

生成描述性统计。

Parameters:
  • 类似数组 (百分位数 -) – 定义要计算的百分位数。如果为None,则使用[25,50,75]。

  • None (默认) – 定义要计算的百分位数。如果为None,则使用[25,50,75]。

  • (默认) (排除 - 类似数组的数据类型) –

    结果中包含的数据类型的白名单。以下是选项:
    • 类似列表的数据类型:将结果限制为提供的数据类型。

    • 无(默认):结果将包括所有数值列。

  • 可选

    结果中包含的数据类型的白名单。以下是选项:
    • 类似列表的数据类型:将结果限制为提供的数据类型。

    • 无(默认):结果将包括所有数值列。

  • (默认)

    要从结果中排除的数据类型的排除列表。对于Series忽略。以下是选项:
    • 类似列表的数据类型:从结果中排除提供的数据类型。

    • 无(默认):结果将不排除任何内容。

  • optional

    要从结果中排除的数据类型的排除列表。对于Series忽略。以下是选项:
    • 类似列表的dtypes:从结果中排除提供的数据类型。

    • None(默认):结果将不排除任何内容。

示例

>>> import torcharrow as ta
>>> df = ta.dataframe({"a": [1, 2, 3, 4, 5],
                      "b": [6, 7, 8, 9, 10]
                      })
>>> df.describe()
index  metric          a         b
-------  --------  -------  --------
    0  count     5         5
    1  mean      3         8
    2  std       1.58114   1.58114
    3  min       1         6
    4  25%       2         7
    5  50%       3         8
    6  75%       4         9
    7  max       5        10
dtype: Struct([Field('metric', string), Field('a', float32), Field('b', float32)]), count: 8, null_count: 0