ray.rllib.policy.sample_batch.SampleBatch.__init__#

SampleBatch.__init__(*args, **kwargs)[源代码]#

构建一个样本批次(与字典构造函数的参数相同)。

注意:所有参数和未列出的关键字参数将按原样传递给父字典构造函数。

参数:
  • _time_major – 此样本批次中的数据是否为时间主序。默认情况下为False,仅在数据包含序列时相关。

  • _max_seq_len – 如果数据包含序列,则最大序列块长度。

  • _zero_padded – 这批数据中的数据是否包含序列,并且这些序列是否根据 _max_seq_len 设置进行了右零填充。

  • _is_training – 此批次是否用于训练。如果为 False,批次可能用于例如动作计算(推理)。