pyspark.RDD.collectWithJobGroup

RDD. collectWithJobGroup ( groupId : str , description : str , interruptOnCancel : bool = False ) → List [ T ] [source]

当收集RDD时,使用此方法来指定作业组。

新增于版本 3.0.0。

自版本 3.1.0 起已弃用: 使用 pyspark.InheritableThread 并启用固定线程模式。

Parameters
groupId str

要分配的组ID。

description str

为作业组设置的描述。

interruptOnCancel bool, optional, default False

是否在作业取消时中断作业。

Returns
list

包含所有元素的列表