双线性¶

class torch.nn.Bilinear(in1_features, in2_features, out_features, bias=True, device=None, dtype=None)[源代码]¶

对传入的数据应用双线性变换： $y = x_1^T A x_2 + b$ .

Parameters

in1_features (int) – 每个第一个输入样本的大小
in2_features (int) – 每个第二个输入样本的大小
out_features (int) – 每个输出样本的大小
偏置 (布尔值) – 如果设置为 False，该层将不会学习一个加性偏置。默认值: True

Shape:

输入1: $(*, H_{in1})$ 其中 $H_{in1}=\text{in1\_features}$ 和 $*$ 表示包括无在内的任意数量的附加维度。输入的所有维度（除了最后一个维度）应该相同。
输入2: $(*, H_{in2})$ 其中 $H_{in2}=\text{in2\_features}$ 。
输出: $(*, H_{out})$ 其中 $H_{out}=\text{out\_features}$ 并且除了最后一个维度之外，其他维度与输入的形状相同。

Variables

权重 (torch.Tensor) – 模块的可学习权重，形状为 $(\text{out\_features}, \text{in1\_features}, \text{in2\_features})$ . 这些值从 $\mathcal{U}(-\sqrt{k}, \sqrt{k})$ 初始化，其中 $k = \frac{1}{\text{in1\_features}}$
偏置 – 模块的可学习偏置，形状为 $(\text{out\_features})$ 。如果 bias 为 True，则这些值从 $\mathcal{U}(-\sqrt{k}, \sqrt{k})$ 中初始化，其中 $k = \frac{1}{\text{in1\_features}}$

示例：

>>> m = nn.Bilinear(20, 30, 40)
>>> input1 = torch.randn(128, 20)
>>> input2 = torch.randn(128, 30)
>>> output = m(input1, input2)
>>> print(output.size())
torch.Size([128, 40])