torch.nn.functional.fractional_max_pool3d¶

torch.nn.functional.fractional_max_pool3d(input, kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)¶

对由多个输入平面组成的输入信号应用3D分数最大池化。

分数最大池化在Ben Graham的论文Fractional MaxPooling中有详细描述

最大池化操作应用于 $kT \times kH \times kW$ 区域，步长由目标输出大小决定。输出特征的数量等于输入平面的数量。

Parameters

kernel_size – 用于取最大值的窗口大小。可以是单个数字 $k$ （用于边长为 $k \times k \times k$ 的方形核）或一个元组 (kT, kH, kW)
output_size – 目标输出尺寸，形式为 $oT \times oH \times oW$ 。可以是元组 (oT, oH, oW) 或单个数字 $oH$ 表示立方体输出 $oH \times oH \times oH$
output_ratio – 如果希望输出大小为输入大小的比例，可以提供此选项。这必须是一个在范围 (0, 1) 内的数字或元组
return_indices – 如果 True，将返回索引以及输出。用于传递给 max_unpool3d()。

Shape:

输入: $(N, C, T_{in}, H_{in}, W_{in})$ 或 $(C, T_{in}, H_{in}, W_{in})$ .
输出: $(N, C, T_{out}, H_{out}, W_{out})$ 或 $(C, T_{out}, H_{out}, W_{out})$ , 其中 $(T_{out}, H_{out}, W_{out})=\text{output\_size}$ 或 $(T_{out}, H_{out}, W_{out})=\text{output\_ratio} \times (T_{in}, H_{in}, W_{in})$

Examples::

>>> input = torch.randn(20, 16, 50, 32, 16)
>>> # 大小为3的立方窗口池化，目标输出大小为13x12x11
>>> F.fractional_max_pool3d(input, 3, output_size=(13, 12, 11))
>>> # 立方窗口池化，目标输出大小为输入大小的一半
>>> F.fractional_max_pool3d(input, 3, output_ratio=(0.5, 0.5, 0.5))