FractionalMaxPool3d¶
- class torch.nn.FractionalMaxPool3d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[源代码]¶
对由多个输入平面组成的输入信号应用3D分数最大池化。
分数最大池化在Ben Graham的论文Fractional MaxPooling中有详细描述
最大池化操作应用于 区域,步长由目标输出大小决定。 输出特征的数量等于输入平面的数量。
注意
必须定义
output_size或output_ratio中的一个。- Parameters
kernel_size (Union[int, Tuple[int, int, int]]) – 窗口的大小,用于取最大值。 可以是单个数字 k(对于 k x k x k 的方形核)或一个元组 (kt x kh x kw)
output_size (Union[int, Tuple[int, int, int]]) – 图像的目标输出大小,形式为 oT x oH x oW。 可以是元组 (oT, oH, oW) 或单个数字 oH 用于正方形图像 oH x oH x oH
output_ratio (Union[float, Tuple[float, float, float]]) – 如果希望输出大小为输入大小的比例,可以提供此选项。 这必须是一个数字或元组,范围在 (0, 1)
return_indices (bool) – 如果为
True,将返回输出结果以及对应的索引。 用于传递给nn.MaxUnpool3d()。默认值:False
- Shape:
输入: 或 .
输出: 或 , 其中 或
示例
>>> # 大小为3的立方窗口池化,目标输出大小为13x12x11 >>> m = nn.FractionalMaxPool3d(3, output_size=(13, 12, 11)) >>> # 立方窗口池化,目标输出大小为输入大小的一半 >>> m = nn.FractionalMaxPool3d(3, output_ratio=(0.5, 0.5, 0.5)) >>> input = torch.randn(20, 16, 50, 32, 16) >>> output = m(input)