dask.bag.random.sample

dask.bag.random.sample

dask.bag.random.sample(population, k, split_every=None)[源代码]

从袋子中选择k个独特的随机元素。

返回一个新的包,其中包含来自总体的元素,同时保持原始总体不变。

参数
人口:袋

要采样的元素。

k: 整数, 可选

要采样的元素数量。

split_every: int (可选)

在进行归约时,将分组划分为此大小的组。默认为8。

示例

>>> import dask.bag as db
>>> from dask.bag import random
>>> b = db.from_sequence(range(5), npartitions=2)
>>> list(random.sample(b, 3).compute())  
[1, 3, 5]