ray.rllib.算法.算法配置.AlgorithmConfig.api_stack#

AlgorithmConfig.api_stack(enable_rl_module_and_learner: bool | None = <ray.rllib.utils.from_config._NotProvided object>, enable_env_runner_and_connector_v2: bool | None = <ray.rllib.utils.from_config._NotProvided object>) AlgorithmConfig[源代码]#

设置配置的API堆栈设置。

参数:
  • enable_rl_module_and_learner – 启用 RLModule`(而不是 `ModelV2)和 Learner(而不是 Policy 中与训练相关的部分)。如果 enable_env_runner_and_connector_v2=False,这两个类(RLModuleLearner)将与 RolloutWorkersPolicy 一起使用。

  • enable_env_runner_and_connector_v2 – 启用 EnvRunners(SingleAgentEnvRunner 和 MultiAgentEnvRunner)和 ConnectorV2 的使用。当设置为 True 时,enable_rl_module_and_learner 也必须为 True。

返回:

这个更新的 AlgorithmConfig 对象。