Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.core.learner.learner.Learner.apply_gradients#

abstract Learner.apply_gradients(gradients_dict: Dict[Hashable, torch.Tensor | tf.Variable]) → None[源代码]#

将梯度应用于 MultiRLModule 参数。

参数:: gradients_dict – 一个与 self._params 相同（扁平）格式的梯度字典。请注意，诸如模块ID等顶层结构将不再存在于这个字典中。它仅仅将梯度张量引用映射到梯度张量。

优云智算