ray.rllib.core.learner.learner.Learner.配置优化器#
- Learner.configure_optimizers() None[源代码]#
配置、创建并注册此学习器的优化器。
优化器负责在训练过程中根据计算出的梯度更新模型的参数。
通常,你不应该为你的自定义算法(需要特定优化器)重写此方法,而是重写
self.configure_optimizers_for_module(module_id=..)方法,并在那里注册你为给定module_id所需的优化器。你可以通过调用
self.register_optimizer()并传递 module_id、optimizer_name(仅在你想为给定模块注册多个优化器时需要)、优化器实例本身、优化器要更新的所有参数列表以及可选的学习率或学习率调度设置,为self.module中的任何 RLModule(或 ALL_MODULES ID)注册一个优化器。此方法在构建期间调用一次(
self.build())。