pyspark.RDD.barrier ¶
-
RDD.
barrier
( ) → pyspark.rdd.RDDBarrier [ T ] [source] ¶ -
将当前阶段标记为屏障阶段,其中Spark必须一起启动所有任务。 如果任务失败,Spark不仅会重新启动失败的任务,还会中止整个阶段并重新启动此阶段的所有任务。 屏障执行模式功能是实验性的,它仅处理有限的情况。 请阅读链接的SPIP和设计文档,以了解限制和未来计划。
新增于版本 2.4.0。
- Returns
-
-
RDDBarrier
-
提供屏障阶段内操作的实例。
-
注释
欲了解更多信息,请参阅
此API为实验性