torch.nn.functional.gelu¶
- torch.nn.functional.gelu(input, approximate='none') 张量¶
当近似参数为‘none’时,它对元素应用函数
其中 是高斯分布的累积分布函数。
当近似参数为‘tanh’时,Gelu 使用以下公式进行估计
参见 高斯误差线性单元 (GELUs)。
当近似参数为‘none’时,它对元素应用函数
其中 是高斯分布的累积分布函数。
当近似参数为‘tanh’时,Gelu 使用以下公式进行估计
参见 高斯误差线性单元 (GELUs)。