pyspark.pandas.DataFrame.sem ¶

DataFrame. sem ( axis : Union[int, str, None] = None , skipna : bool = True , ddof : int = 1 , numeric_only : bool = None ) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, Series] ¶

返回请求轴上的平均值的无偏标准误差。

新增于版本 3.3.0。

Parameters

axis: {index (0), columns (1)}: 要应用函数的轴。
skipna: bool, default True: 计算结果时排除NA/null值。

版本3.4.0更改：支持包含NA/空值。
ddof: int, default 1: 自由度的增量。计算中使用的除数是 N - ddof，其中 N 表示元素的数量。

在版本3.4.0中更改: 支持包含任意整数。
numeric_only: bool, default None: 仅包含浮点数、整数、布尔列。不支持False。此参数主要用于pandas兼容性。

Returns

scalar(for Series) or Series(for DataFrame)

示例

           >>> psdf = ps.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
>>> psdf
   a  b
0  1  4
1  2  5
2  3  6

          

           >>> psdf.sem()
a    0.57735
b    0.57735
dtype: float64

          

           >>> psdf.sem(ddof=0)
a    0.471405
b    0.471405
dtype: float64

          

           >>> psdf.sem(ddof=2)
a    0.816497
b    0.816497
dtype: float64

          

           >>> psdf.sem(axis=1)
0    1.5
1    1.5
2    1.5
dtype: float64

          

支持系列

           >>> psser = psdf.a
>>> psser
0    1
1    2
2    3
Name: a, dtype: int64

          

           >>> psser.sem()
0.5773502691896258

           >>> psser.sem(ddof=0)
0.47140452079103173

pyspark.pandas.DataFrame.nunique

pyspark.pandas.DataFrame.偏度