Shortcuts

双线性

class torch.nn.Bilinear(in1_features, in2_features, out_features, bias=True, device=None, dtype=None)[源代码]

对传入的数据应用双线性变换:y=x1TAx2+by = x_1^T A x_2 + b.

Parameters
  • in1_features (int) – 每个第一个输入样本的大小

  • in2_features (int) – 每个第二个输入样本的大小

  • out_features (int) – 每个输出样本的大小

  • 偏置 (布尔值) – 如果设置为 False,该层将不会学习一个加性偏置。 默认值: True

Shape:
  • 输入1: (,Hin1)(*, H_{in1}) 其中 Hin1=in1_featuresH_{in1}=\text{in1\_features}* 表示包括无在内的任意数量的附加维度。输入的所有维度(除了最后一个维度)应该相同。

  • 输入2: (,Hin2)(*, H_{in2}) 其中 Hin2=in2_featuresH_{in2}=\text{in2\_features}

  • 输出: (,Hout)(*, H_{out}) 其中 Hout=out_featuresH_{out}=\text{out\_features} 并且除了最后一个维度之外,其他维度与输入的形状相同。

Variables
  • 权重 (torch.Tensor) – 模块的可学习权重,形状为 (out_features,in1_features,in2_features)(\text{out\_features}, \text{in1\_features}, \text{in2\_features}). 这些值从 U(k,k)\mathcal{U}(-\sqrt{k}, \sqrt{k}) 初始化,其中 k=1in1_featuresk = \frac{1}{\text{in1\_features}}

  • 偏置 – 模块的可学习偏置,形状为 (out_features)(\text{out\_features})。 如果 biasTrue,则这些值从 U(k,k)\mathcal{U}(-\sqrt{k}, \sqrt{k}) 中初始化,其中 k=1in1_featuresk = \frac{1}{\text{in1\_features}}

示例:

>>> m = nn.Bilinear(20, 30, 40)
>>> input1 = torch.randn(128, 20)
>>> input2 = torch.randn(128, 30)
>>> output = m(input1, input2)
>>> print(output.size())
torch.Size([128, 40])
优云智算