ray.rllib.policy.sample_batch.SampleBatch.__init__#
- SampleBatch.__init__(*args, **kwargs)[源代码]#
构建一个样本批次(与字典构造函数的参数相同)。
注意:所有参数和未列出的关键字参数将按原样传递给父字典构造函数。
- 参数:
_time_major – 此样本批次中的数据是否为时间主序。默认情况下为False,仅在数据包含序列时相关。
_max_seq_len – 如果数据包含序列,则最大序列块长度。
_zero_padded – 这批数据中的数据是否包含序列,并且这些序列是否根据
_max_seq_len设置进行了右零填充。_is_training – 此批次是否用于训练。如果为 False,批次可能用于例如动作计算(推理)。