pyspark.pandas.DataFrame.all ¶
-
DataFrame.
all
( axis : Union [ int , str ] = 0 , bool_only : Optional [ bool ] = None , skipna : bool = True ) → Series [source] ¶ -
返回是否所有元素都为真。
除非序列中至少有一个元素为False或等效(例如零或空),否则返回True
- Parameters
-
- axis {0 or ‘index’}, default 0
-
指示应减少哪个轴或哪些轴。
-
0 / ‘index’ : 减少索引,返回一个索引为原始列标签的Series。
-
- bool_only bool, default None
-
仅包含布尔列。如果为None,将尝试使用所有内容,然后仅使用布尔数据。
- skipna boolean, default True
-
排除NA值,例如None或numpy.NaN。 如果整行/列都是NA值且 skipna 为True, 则结果将为True,因为对于空行/列。 如果 skipna 为False,numpy.NaNs被视为True,因为这些不等于零,Nones被视为False。
- Returns
-
- Series
示例
从字典创建一个数据框。
>>> df = ps.DataFrame({ ... 'col1': [True, True, True], ... 'col2': [True, False, False], ... 'col3': [0, 0, 0], ... 'col4': [1, 2, 3], ... 'col5': [True, True, None], ... 'col6': [True, False, None]}, ... columns=['col1', 'col2', 'col3', 'col4', 'col5', 'col6'])
默认行为检查列值是否全部返回 True。
>>> df.all() col1 True col2 False col3 False col4 True col5 True col6 False dtype: bool
当设置 skipna=False 时,包含NA值。
>>> df[['col5', 'col6']].all(skipna=False) col5 False col6 False dtype: bool
当设置 bool_only=True 时,仅包含布尔列。
>>> df.all(bool_only=True) col1 True col2 False dtype: bool