ray.rllib.core.rl_模块.多重_rl_模块.MultiRLModule.forward_训练#
- MultiRLModule.forward_train(batch: SampleBatch | MultiAgentBatch | Dict[str, Any], **kwargs) Dict[str, Any]#
训练期间的前向传递,从学习者调用。此方法不应被重写。相反,应重写 _forward_train 方法。
- 参数:
batch – 输入批次。这个输入批次应符合 input_specs_train() 的要求。
**kwargs – 附加的关键字参数。
- 返回:
前向传播的输出。该输出应符合 output_specs_train() 的要求。