pymc.adamax#

pymc.adamax(loss_or_grads=None, params=None, learning_rate=0.002, beta1=0.9, beta2=0.999, epsilon=1e-08)[源代码]#

Adamax 更新

Adamax 更新实现如 [1] 所示。这是基于无穷范数的 Adam 算法的一个变体。

参数:
loss_or_grads: 符号表达式或表达式列表

一个标量损失表达式,或一个梯度表达式列表

参数: 共享变量的列表

用于生成更新表达式的变量

learning_rate: float

学习率

beta1: float

指数衰减率用于第一次矩估计。

beta2: float

加权无穷范数估计的指数衰减率。

epsilon: float

用于数值稳定的常数。

返回:
OrderedDict

一个字典,将每个参数映射到其更新表达式

注释

优化器可以在不传入 loss_or_grads 和 params 的情况下调用,在这种情况下会返回一个偏函数。

参考文献

[1]

Kingma, Diederik, 和 Jimmy Ba (2014): Adam: 一种随机优化方法。arXiv 预印本 arXiv:1412.6980。

示例

>>> a = pytensor.shared(1.)
>>> b = a*2
>>> updates = adamax(b, [a], learning_rate=.01)
>>> isinstance(updates, dict)
True
>>> optimizer = adamax(learning_rate=.01)
>>> callable(optimizer)
True
>>> updates = optimizer(b, [a])
>>> isinstance(updates, dict)
True