InstanceNorm1d¶
- class torch.nn.InstanceNorm1d(num_features, eps=1e-05, momentum=0.1, affine=False, track_running_stats=False, device=None, dtype=None)[源代码]¶
应用实例归一化。
此操作在2D(未批处理)或3D(批处理)输入上应用实例归一化,如论文中所述 实例归一化:快速风格化的缺失成分。
均值和标准差是针对每个对象在每个小批次中分别按维度计算的。 和 是可学习的参数向量,大小为 C(其中 C 是输入的特征或通道数),如果
affine为True。标准差是通过有偏估计量计算的,等同于 torch.var(input, unbiased=False)。默认情况下,该层在训练和评估模式下都使用从输入数据计算的实例统计数据。
如果
track_running_stats设置为True,在训练期间,该层会保持对其计算的均值和方差的运行估计,这些估计值在评估期间用于归一化。运行估计值的默认momentum为 0.1。注意
这个
momentum参数与优化器类中使用的参数和常规动量概念不同。数学上,这里的运行统计更新规则是 , 其中 是估计的统计量, 是新的观测值。注意
InstanceNorm1d和LayerNorm非常相似,但有一些细微的差异。InstanceNorm1d应用于像多维时间序列这样的通道数据的每个通道,但LayerNorm通常应用于整个样本,并且经常用于NLP任务。此外,LayerNorm应用逐元素仿射变换,而InstanceNorm1d通常不应用仿射变换。- Parameters
num_features (int) – 特征或通道的数量 的输入
eps (float) – 为了数值稳定性而添加到分母中的值。默认值:1e-5
动量 (float) – 用于计算running_mean和running_var的值。默认值:0.1
仿射 (bool) – 一个布尔值,当设置为
True时,此模块具有可学习的仿射参数,初始化方式与批量归一化相同。 默认值:False。track_running_stats (bool) – 一个布尔值,当设置为
True时,此模块会跟踪运行中的均值和方差,当设置为False时,此模块不会跟踪此类统计信息,并且在训练和评估模式下始终使用批量统计信息。默认值:False
- Shape:
输入: 或
输出: 或 (与输入形状相同)
示例:
>>> # 没有可学习参数 >>> m = nn.InstanceNorm1d(100) >>> # 有可学习参数 >>> m = nn.InstanceNorm1d(100, affine=True) >>> input = torch.randn(20, 100, 40) >>> output = m(input)