speechbrain.nnet.quaternion_networks.q_normalization 模块

实现四元数值归一化的库。

Authors
  • Titouan Parcollet 2020

  • 德鲁·瓦格纳 2024

摘要

类:

QBatchNorm

该类实现了最简单的四元数批归一化形式,如“用于彩色图像分类和取证的四元数卷积神经网络”中所述,作者为Qilin Y。

参考

class speechbrain.nnet.quaternion_networks.q_normalization.QBatchNorm(input_size, dim=-1, gamma_init=1.0, beta_param=True, momentum=0.1, eps=0.0001, track_running_stats=True)[source]

基础:Module

该类实现了最简单的四元数批量归一化形式,如“用于彩色图像分类和取证的四元数卷积神经网络”中所述,作者为Qilin Y.等人。

Parameters:
  • input_size (int) – 预期要归一化的维度大小。

  • dim (int, 可选) – 它定义了应该被标准化的轴。通常对应于通道维度(默认值为-1)。

  • gamma_init (float, optional) – 使用的第一个gamma值(均值)(默认值为1.0)。

  • beta_param (bool, 可选) – 当设置为True时,BN的beta参数将被应用(默认为True)。

  • 动量 (浮点数, 可选) – 它定义了实值批量归一化的动量(默认值为0.1)。

  • eps (float, optional) – 用于稳定操作的项(默认值为1e-4)。

  • track_running_stats (bool, optional) – 等同于实值批归一化参数。 当为True时,统计信息会被跟踪。当为False时,仅使用在批次上计算的统计信息(默认为True)。

Example

>>> inp_tensor = torch.rand([10, 40])
>>> QBN = QBatchNorm(input_size=40)
>>> out_tensor = QBN(inp_tensor)
>>> out_tensor.shape
torch.Size([10, 40])
forward(input)[source]

返回归一化的输入张量。

Parameters:

输入 (torch.Tensor (批次, 时间, [通道])) – 需要标准化的输入。它可以是2d、3d、4d。

Return type:

归一化的输入。