pyspark.pandas.Index.unique

Index. unique ( level : Union[int, Any, Tuple[Any, …], None] = None ) → pyspark.pandas.indexes.base.Index [source]

返回索引中的唯一值。

请注意,唯一值的顺序可能与 pandas.Index.unique 不同

Parameters
level int or str, optional, default is None
Returns
Index without duplicates

示例

>>> ps.DataFrame({'a': ['a', 'b', 'c']}, index=[1, 1, 3]).index.unique().sort_values()
... 
Int64Index([1, 3], dtype='int64')
>>> ps.DataFrame({'a': ['a', 'b', 'c']}, index=['d', 'e', 'e']).index.unique().sort_values()
Index(['d', 'e'], dtype='object')

多重索引

>>> ps.MultiIndex.from_tuples([("A", "X"), ("A", "Y"), ("A", "X")]).unique()
... 
MultiIndex([('A', 'X'),
            ('A', 'Y')],
           )