pyspark.pandas.groupby.SeriesGroupBy.unique ¶

SeriesGroupBy. unique ( ) → pyspark.pandas.series.Series [source] ¶

返回组中的唯一值。

Unique 是按未知顺序返回的。它不会进行排序。

另请参阅

示例

           >>> df = ps.DataFrame({'a': [1, 1, 1, 2, 2, 2, 3, 3, 3],
...                    'b': [1, 2, 2, 2, 3, 3, 3, 4, 4]}, columns=['a', 'b'])

           >>> df.groupby(['a'])['b'].unique().sort_index()  
a
1    [1, 2]
2    [2, 3]
3    [3, 4]
Name: b, dtype: object

          

pyspark.pandas.groupby.SeriesGroupBy.value_counts

重采样