torch.nn.functional.conv2d¶

torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) → 张量¶

对由多个输入平面组成的输入图像应用二维卷积。

此操作符支持 TensorFloat32。

有关详细信息和输出形状，请参见 Conv2d。

注意

在某些情况下，当给定的张量位于CUDA设备上并使用CuDNN时，此操作符可能会选择一个非确定性算法以提高性能。如果这是不可取的，您可以尝试通过设置torch.backends.cudnn.deterministic = True来使操作具有确定性（可能会以性能为代价）。更多信息请参见可重复性。

注意

此操作符支持复杂数据类型，即 complex32, complex64, complex128。

Parameters

输入 – 输入张量的形状为 $(\text{minibatch} , \text{in\_channels} , iH , iW)$
权重 – 形状为 $(\text{out\_channels} , \frac{\text{in\_channels}}{\text{groups}} , kH , kW)$
偏置 – 可选的偏置张量，形状为 $(\text{out\_channels})$ 。默认值：None
步幅 – 卷积核的步幅。可以是单个数字或元组 (sH, sW)。默认值：1
padding –
输入两边的隐式填充。可以是字符串 {'valid', 'same'}，单个数字或一个元组 (padH, padW)。默认值：0 padding='valid' 等同于没有填充。padding='same' 填充输入，使得输出与输入具有相同的形状。然而，此模式不支持除1以外的任何步幅值。

警告

对于 padding='same'，如果 weight 是偶数长度且 dilation 在任何维度上是奇数，可能需要在内部进行完整的 pad() 操作。这可能会降低性能。
dilation – 核元素之间的间距。可以是单个数字或元组 (dH, dW)。默认值：1
groups – 将输入分成多个组， $\text{in\_channels}$ 和 $\text{out\_channels}$ 都应能被组的数量整除。默认值：1

示例：

>>> # 使用方形内核和相等的步幅
>>> filters = torch.randn(8, 4, 3, 3)
>>> inputs = torch.randn(1, 4, 5, 5)
>>> F.conv2d(inputs, filters, padding=1)