ray.rllib.算法.算法配置.AlgorithmConfig.api_stack#

AlgorithmConfig.api_stack(enable_rl_module_and_learner: bool | None = <ray.rllib.utils.from_config._NotProvided object>, enable_env_runner_and_connector_v2: bool | None = <ray.rllib.utils.from_config._NotProvided object>) → AlgorithmConfig[源代码]#

设置配置的API堆栈设置。

参数:

enable_rl_module_and_learner – 启用 RLModule`（而不是 `ModelV2）和 Learner（而不是 Policy 中与训练相关的部分）。如果 enable_env_runner_and_connector_v2=False，这两个类（RLModule 和 Learner）将与 RolloutWorkers 和 Policy 一起使用。
enable_env_runner_and_connector_v2 – 启用 EnvRunners（SingleAgentEnvRunner 和 MultiAgentEnvRunner）和 ConnectorV2 的使用。当设置为 True 时，enable_rl_module_and_learner 也必须为 True。

返回:

这个更新的 AlgorithmConfig 对象。