pyspark.pandas.window.Expanding.mean

Expanding. mean ( ) → FrameLike [source]

计算值的扩展平均值。

注意

此API的当前实现使用了Spark的Window,但没有指定分区规范。这会导致将所有数据移动到单个机器的单个分区中,并可能导致严重的性能下降。请避免在非常大的数据集上使用此方法。

Returns
Series or DataFrame

返回的对象类型由扩展计算的调用者决定。

另请参阅

pyspark.pandas.Series.expanding

使用 Series 数据调用对象。

pyspark.pandas.DataFrame.expanding

使用 DataFrame 调用对象。

pyspark.pandas.Series.mean

Series的等效方法。

pyspark.pandas.DataFrame.mean

DataFrame的等效方法。

示例

下面的示例将分别展示使用窗口大小为两个和三个的扩展平均值计算。

>>> s = ps.Series([1, 2, 3, 4])
>>> s.expanding(2).mean()
0    NaN
1    1.5
2    2.0
3    2.5
dtype: float64
>>> s.expanding(3).mean()
0    NaN
1    NaN
2    2.0
3    2.5
dtype: float64