ray.rllib.evaluation.rollout_worker.RolloutWorker.foreach_policy#

RolloutWorker.foreach_policy(func: Callable[[Policy, str, Any | None], T], **kwargs) List[T][源代码]#

使用每个 (策略, 策略ID) 元组调用给定的函数。

参数:

func – 每个 (策略, 策略ID) 元组调用的函数。

关键字参数:

kwargs – 要传递给调用的额外关键字参数。

返回:

所有调用 func([policy, pid, **kwargs]) 的返回值列表。