polars.LazyFrame.approx_n_unique#

LazyFrame.approx_n_unique() LazyFrame[source]#

唯一值的近似计数。

自版本0.20.11起已弃用:请改用select(pl.all().approx_n_unique())

这是使用HyperLogLog++算法进行基数估计的。

示例

>>> lf = pl.LazyFrame(
...     {
...         "a": [1, 2, 3, 4],
...         "b": [1, 2, 1, 1],
...     }
... )
>>> lf.approx_n_unique().collect()  
shape: (1, 2)
┌─────┬─────┐
│ a   ┆ b   │
│ --- ┆ --- │
│ u32 ┆ u32 │
╞═════╪═════╡
│ 4   ┆ 2   │
└─────┴─────┘