pyspark.pandas.DataFrame.sem ¶
-
DataFrame.
sem
( axis : Union[int, str, None] = None , skipna : bool = True , ddof : int = 1 , numeric_only : bool = None ) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, Series] ¶ -
返回请求轴上的平均值的无偏标准误差。
新增于版本 3.3.0。
- Parameters
-
- axis: {index (0), columns (1)}
-
要应用函数的轴。
- skipna: bool, default True
-
计算结果时排除NA/null值。
版本3.4.0更改: 支持包含NA/空值。
- ddof: int, default 1
-
自由度的增量。计算中使用的除数是 N - ddof,其中 N 表示元素的数量。
在版本3.4.0中更改: 支持包含任意整数。
- numeric_only: bool, default None
-
仅包含浮点数、整数、布尔列。不支持False。此参数主要用于pandas兼容性。
- Returns
-
- scalar(for Series) or Series(for DataFrame)
示例
>>> psdf = ps.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]}) >>> psdf a b 0 1 4 1 2 5 2 3 6
>>> psdf.sem() a 0.57735 b 0.57735 dtype: float64
>>> psdf.sem(ddof=0) a 0.471405 b 0.471405 dtype: float64
>>> psdf.sem(ddof=2) a 0.816497 b 0.816497 dtype: float64
>>> psdf.sem(axis=1) 0 1.5 1 1.5 2 1.5 dtype: float64
支持系列
>>> psser = psdf.a >>> psser 0 1 1 2 2 3 Name: a, dtype: int64
>>> psser.sem() 0.5773502691896258
>>> psser.sem(ddof=0) 0.47140452079103173