speechbrain.nnet.quaternion_networks.q_normalization 模块

实现四元数值归一化的库。

Authors

Titouan Parcollet 2020
德鲁·瓦格纳 2024

摘要

类：

QBatchNorm

该类实现了最简单的四元数批归一化形式，如“用于彩色图像分类和取证的四元数卷积神经网络”中所述，作者为Qilin Y。

参考

class speechbrain.nnet.quaternion_networks.q_normalization.QBatchNorm(input_size, dim=-1, gamma_init=1.0, beta_param=True, momentum=0.1, eps=0.0001, track_running_stats=True)[source]

基础：Module

该类实现了最简单的四元数批量归一化形式，如“用于彩色图像分类和取证的四元数卷积神经网络”中所述，作者为Qilin Y.等人。

Parameters:

input_size (int) – 预期要归一化的维度大小。
dim (int, 可选) – 它定义了应该被标准化的轴。通常对应于通道维度（默认值为-1）。
gamma_init (float, optional) – 使用的第一个gamma值（均值）（默认值为1.0）。
beta_param (bool, 可选) – 当设置为True时，BN的beta参数将被应用（默认为True）。
动量 (浮点数, 可选) – 它定义了实值批量归一化的动量（默认值为0.1）。
eps (float, optional) – 用于稳定操作的项（默认值为1e-4）。
track_running_stats (bool, optional) – 等同于实值批归一化参数。当为True时，统计信息会被跟踪。当为False时，仅使用在批次上计算的统计信息（默认为True）。

Example

>>> inp_tensor = torch.rand([10, 40])
>>> QBN = QBatchNorm(input_size=40)
>>> out_tensor = QBN(inp_tensor)
>>> out_tensor.shape
torch.Size([10, 40])

forward(input)[source]

返回归一化的输入张量。

Parameters:: 输入 (torch.Tensor (批次, 时间, [通道])) – 需要标准化的输入。它可以是2d、3d、4d。
Return type:: 归一化的输入。