pyspark.pandas.DataFrame.sem

DataFrame. sem ( axis : Union[int, str, None] = None , skipna : bool = True , ddof : int = 1 , numeric_only : bool = None ) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, Series]

返回请求轴上的平均值的无偏标准误差。

新增于版本 3.3.0。

Parameters
axis: {index (0), columns (1)}

要应用函数的轴。

skipna: bool, default True

计算结果时排除NA/null值。

版本3.4.0更改: 支持包含NA/空值。

ddof: int, default 1

自由度的增量。计算中使用的除数是 N - ddof,其中 N 表示元素的数量。

在版本3.4.0中更改: 支持包含任意整数。

numeric_only: bool, default None

仅包含浮点数、整数、布尔列。不支持False。此参数主要用于pandas兼容性。

Returns
scalar(for Series) or Series(for DataFrame)

示例

>>> psdf = ps.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
>>> psdf
   a  b
0  1  4
1  2  5
2  3  6
>>> psdf.sem()
a    0.57735
b    0.57735
dtype: float64
>>> psdf.sem(ddof=0)
a    0.471405
b    0.471405
dtype: float64
>>> psdf.sem(ddof=2)
a    0.816497
b    0.816497
dtype: float64
>>> psdf.sem(axis=1)
0    1.5
1    1.5
2    1.5
dtype: float64

支持系列

>>> psser = psdf.a
>>> psser
0    1
1    2
2    3
Name: a, dtype: int64
>>> psser.sem()
0.5773502691896258
>>> psser.sem(ddof=0)
0.47140452079103173