pyspark.streaming.DStream.window

DStream. window ( windowDuration : int , slideDuration : Optional [ int ] = None ) → pyspark.streaming.dstream.DStream [ T ] [source]

返回一个新的DStream,其中每个RDD包含在此DStream上滑动时间窗口内看到的所有元素。

Parameters
windowDuration int

窗口的宽度;必须是此DStream的批处理间隔的倍数

slideDuration int, optional

窗口的滑动间隔(即,新DStream将生成RDDs的时间间隔);必须是此DStream的批处理间隔的倍数