dask.bag.Bag.repartition

dask.bag.Bag.repartition

Bag.repartition(npartitions=None, partition_size=None)[源代码]

在新分区中重新分配袋子。

参数
npartitionsint, 可选

输出分区的数量。

分区大小int 或 string, 可选

每个分区的最大内存字节数。使用数字或类似 5MB 的字符串。

警告

此关键字参数触发计算以确定每个分区的内存大小,这可能很耗费资源。

注释

必须指定 npartitionspartition_size 中的一个。如果不是这种情况,将引发 ValueError

示例

>>> b.repartition(5)  # set to have 5 partitions