torcharrow.DataFrame.describe¶

DataFrame.describe(percentiles=None, include=None, exclude=None)¶

生成描述性统计。

Parameters:

类似数组 (百分位数 -) – 定义要计算的百分位数。如果为None，则使用[25,50,75]。
None (默认) – 定义要计算的百分位数。如果为None，则使用[25,50,75]。
(默认) (排除 - 类似数组的数据类型 或无) –
结果中包含的数据类型的白名单。以下是选项：
- 类似列表的数据类型：将结果限制为提供的数据类型。
- 无（默认）：结果将包括所有数值列。
可选 –
结果中包含的数据类型的白名单。以下是选项：
- 类似列表的数据类型：将结果限制为提供的数据类型。
- 无（默认）：结果将包括所有数值列。
(默认) –
要从结果中排除的数据类型的排除列表。对于Series忽略。以下是选项：
- 类似列表的数据类型：从结果中排除提供的数据类型。
- 无（默认）：结果将不排除任何内容。
optional –
要从结果中排除的数据类型的排除列表。对于Series忽略。以下是选项：
- 类似列表的dtypes：从结果中排除提供的数据类型。
- None（默认）：结果将不排除任何内容。

示例

>>> import torcharrow as ta
>>> df = ta.dataframe({"a": [1, 2, 3, 4, 5],
                      "b": [6, 7, 8, 9, 10]
                      })
>>> df.describe()
index  metric          a         b
-------  --------  -------  --------
    0  count     5         5
    1  mean      3         8
    2  std       1.58114   1.58114
    3  min       1         6
    4  25%       2         7
    5  50%       3         8
    6  75%       4         9
    7  max       5        10
dtype: Struct([Field('metric', string), Field('a', float32), Field('b', float32)]), count: 8, null_count: 0