pyspark.pandas.groupby.GroupBy.prod ¶
-
GroupBy.
prod
( numeric_only : Optional [ bool ] = True , min_count : int = 0 ) → FrameLike [source] ¶ -
计算组的乘积。
新增于版本 3.4.0。
- Parameters
-
- numeric_only bool, default False
-
仅包含浮点数、整数、布尔类型的列。如果为None,将尝试使用所有列,然后仅使用数值数据。
- min_count int, default 0
-
执行操作所需的有效值数量。 如果少于 min_count 个非 NA 值,结果将为 NA。
- Returns
-
- Series or DataFrame
-
计算每个组内值的乘积。
示例
>>> import numpy as np >>> df = ps.DataFrame( ... { ... "A": [1, 1, 2, 1, 2], ... "B": [np.nan, 2, 3, 4, 5], ... "C": [1, 2, 1, 1, 2], ... "D": [True, False, True, False, True], ... } ... )
按一列分组并返回每个组中其余列的乘积。
>>> df.groupby('A').prod().sort_index() B C D A 1 8.0 2 0 2 15.0 2 1
>>> df.groupby('A').prod(min_count=3).sort_index() B C D A 1 NaN 2.0 0.0 2 NaN NaN NaN