pyspark.pandas.groupby.GroupBy.prod

GroupBy. prod ( numeric_only : Optional [ bool ] = True , min_count : int = 0 ) → FrameLike [source]

计算组的乘积。

新增于版本 3.4.0。

Parameters
numeric_only bool, default False

仅包含浮点数、整数、布尔类型的列。如果为None,将尝试使用所有列,然后仅使用数值数据。

min_count int, default 0

执行操作所需的有效值数量。 如果少于 min_count 个非 NA 值,结果将为 NA。

Returns
Series or DataFrame

计算每个组内值的乘积。

示例

>>> import numpy as np
>>> df = ps.DataFrame(
...     {
...         "A": [1, 1, 2, 1, 2],
...         "B": [np.nan, 2, 3, 4, 5],
...         "C": [1, 2, 1, 1, 2],
...         "D": [True, False, True, False, True],
...     }
... )

按一列分组并返回每个组中其余列的乘积。

>>> df.groupby('A').prod().sort_index()
     B  C  D
A
1  8.0  2  0
2  15.0 2  1
>>> df.groupby('A').prod(min_count=3).sort_index()
     B  C   D
A
1  NaN  2.0  0.0
2  NaN NaN  NaN