pyspark.pandas.groupby.GroupBy.min

GroupBy. min ( numeric_only : Optional [ bool ] = False , min_count : int = - 1 ) → FrameLike [source]

计算组值的最小值。

新增于版本 3.3.0。

Parameters
numeric_only bool, default False

仅包含浮点数、整数、布尔类型的列。如果为None,将尝试使用所有列,然后仅使用数值数据。

新增于版本 3.4.0。

min_count bool, default -1

执行操作所需的有效值数量。如果少于 min_count 个非 NA 值,结果将为 NA。

新增于版本 3.4.0。

示例

>>> df = ps.DataFrame({"A": [1, 2, 1, 2], "B": [True, False, False, True],
...                    "C": [3, 4, 3, 4], "D": ["a", "a", "b", "a"]})
>>> df.groupby("A").min().sort_index()
       B  C  D
A
1  False  3  a
2  False  4  a

当设置 numeric_only 为 True 时,仅包含 float、int、boolean 列。

>>> df.groupby("A").min(numeric_only=True).sort_index()
       B  C
A
1  False  3
2  False  4
>>> df.groupby("D").min().sort_index()
   A      B  C
D
a  1  False  3
b  1  False  3
>>> df.groupby("D").min(min_count=3).sort_index()
     A      B    C
D
a  1.0  False  3.0
b  NaN   None  NaN