polars.Series.describe#
- Series.describe(
- percentiles: Sequence[float] | float | None = (0.25, 0.5, 0.75),
- interpolation: RollingInterpolationMethod = 'nearest',
系列的快速摘要统计。
包含混合数据类型的Series将返回第一个值的数据类型的汇总统计信息。
- Parameters:
- percentiles
要包含在汇总统计中的一个或多个百分位数(如果Series具有数值类型)。所有值必须在
[0, 1]范围内。- interpolation{‘nearest’, ‘higher’, ‘lower’, ‘midpoint’, ‘linear’}
计算百分位数时使用的插值方法。
- Returns:
- DataFrame
使用Series的摘要统计进行映射。
注释
默认情况下,中位数作为50%百分位数被包含在内。
示例
>>> s = pl.Series([1, 2, 3, 4, 5]) >>> s.describe() shape: (9, 2) ┌────────────┬──────────┐ │ statistic ┆ value │ │ --- ┆ --- │ │ str ┆ f64 │ ╞════════════╪══════════╡ │ count ┆ 5.0 │ │ null_count ┆ 0.0 │ │ mean ┆ 3.0 │ │ std ┆ 1.581139 │ │ min ┆ 1.0 │ │ 25% ┆ 2.0 │ │ 50% ┆ 3.0 │ │ 75% ┆ 4.0 │ │ max ┆ 5.0 │ └────────────┴──────────┘
非数值数据类型可能无法提供所有统计信息。
>>> s = pl.Series(["aa", "aa", None, "bb", "cc"]) >>> s.describe() shape: (4, 2) ┌────────────┬───────┐ │ statistic ┆ value │ │ --- ┆ --- │ │ str ┆ str │ ╞════════════╪═══════╡ │ count ┆ 4 │ │ null_count ┆ 1 │ │ min ┆ aa │ │ max ┆ cc │ └────────────┴───────┘