pyspark.streaming.DStream.window ¶
-
DStream.
window
( windowDuration : int , slideDuration : Optional [ int ] = None ) → pyspark.streaming.dstream.DStream [ T ] [source] ¶ -
返回一个新的DStream,其中每个RDD包含在此DStream上滑动时间窗口内看到的所有元素。
- Parameters
-
- windowDuration int
-
窗口的宽度;必须是此DStream的批处理间隔的倍数
- slideDuration int, optional
-
窗口的滑动间隔(即,新DStream将生成RDDs的时间间隔);必须是此DStream的批处理间隔的倍数