ray.rllib.core.learner.learner.Learner.配置优化器#

Learner.configure_optimizers() None[源代码]#

配置、创建并注册此学习器的优化器。

优化器负责在训练过程中根据计算出的梯度更新模型的参数。

通常,你不应该为你的自定义算法(需要特定优化器)重写此方法,而是重写 self.configure_optimizers_for_module(module_id=..) 方法,并在那里注册你为给定 module_id 所需的优化器。

你可以通过调用 self.register_optimizer() 并传递 module_id、optimizer_name(仅在你想为给定模块注册多个优化器时需要)、优化器实例本身、优化器要更新的所有参数列表以及可选的学习率或学习率调度设置,为 self.module 中的任何 RLModule(或 ALL_MODULES ID)注册一个优化器。

此方法在构建期间调用一次(self.build())。