pyspark.pandas.groupby.GroupBy.prod ¶

GroupBy. prod ( numeric_only : Optional [ bool ] = True , min_count : int = 0 ) → FrameLike [source] ¶

计算组的乘积。

新增于版本 3.4.0。

Parameters

numeric_only bool, default False: 仅包含浮点数、整数、布尔类型的列。如果为None，将尝试使用所有列，然后仅使用数值数据。
min_count int, default 0: 执行操作所需的有效值数量。如果少于 min_count 个非 NA 值，结果将为 NA。

Returns

Series or DataFrame: 计算每个组内值的乘积。

另请参阅

pyspark.pandas.Series.groupby
pyspark.pandas.DataFrame.groupby

示例

           >>> import numpy as np
>>> df = ps.DataFrame(
...     {
...         "A": [1, 1, 2, 1, 2],
...         "B": [np.nan, 2, 3, 4, 5],
...         "C": [1, 2, 1, 1, 2],
...         "D": [True, False, True, False, True],
...     }
... )

          

按一列分组并返回每个组中其余列的乘积。

           >>> df.groupby('A').prod().sort_index()
     B  C  D
A
1  8.0  2  0
2  15.0 2  1

          

           >>> df.groupby('A').prod(min_count=3).sort_index()
     B  C   D
A
1  NaN  2.0  0.0
2  NaN NaN  NaN

          

pyspark.pandas.groupby.GroupBy.nth

pyspark.pandas.groupby.GroupBy.rank