dask.bag.Bag.repartition
dask.bag.Bag.repartition¶
- Bag.repartition(npartitions=None, partition_size=None)[源代码]¶
在新分区中重新分配袋子。
- 参数
- npartitionsint, 可选
输出分区的数量。
- 分区大小int 或 string, 可选
每个分区的最大内存字节数。使用数字或类似 5MB 的字符串。
警告
此关键字参数触发计算以确定每个分区的内存大小,这可能很耗费资源。
注释
必须指定
npartitions或partition_size中的一个。如果不是这种情况,将引发ValueError。示例
>>> b.repartition(5) # set to have 5 partitions