Shortcuts

torch.nn.functional.fractional_max_pool3d

torch.nn.functional.fractional_max_pool3d(input, kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)

对由多个输入平面组成的输入信号应用3D分数最大池化。

分数最大池化在Ben Graham的论文Fractional MaxPooling中有详细描述

最大池化操作应用于 kT×kH×kWkT \times kH \times kW 区域,步长由目标输出大小决定。 输出特征的数量等于输入平面的数量。

Parameters
  • kernel_size – 用于取最大值的窗口大小。可以是单个数字 kk(用于边长为 k×k×kk \times k \times k 的方形核)或一个元组 (kT, kH, kW)

  • output_size – 目标输出尺寸,形式为 oT×oH×oWoT \times oH \times oW。 可以是元组 (oT, oH, oW) 或单个数字 oHoH 表示立方体输出 oH×oH×oHoH \times oH \times oH

  • output_ratio – 如果希望输出大小为输入大小的比例,可以提供此选项。 这必须是一个在范围 (0, 1) 内的数字或元组

  • return_indices – 如果 True,将返回索引以及输出。 用于传递给 max_unpool3d()

Shape:
  • 输入: (N,C,Tin,Hin,Win)(N, C, T_{in}, H_{in}, W_{in})(C,Tin,Hin,Win)(C, T_{in}, H_{in}, W_{in}).

  • 输出: (N,C,Tout,Hout,Wout)(N, C, T_{out}, H_{out}, W_{out})(C,Tout,Hout,Wout)(C, T_{out}, H_{out}, W_{out}), 其中 (Tout,Hout,Wout)=output_size(T_{out}, H_{out}, W_{out})=\text{output\_size}(Tout,Hout,Wout)=output_ratio×(Tin,Hin,Win)(T_{out}, H_{out}, W_{out})=\text{output\_ratio} \times (T_{in}, H_{in}, W_{in})

Examples::
>>> input = torch.randn(20, 16, 50, 32, 16)
>>> # 大小为3的立方窗口池化,目标输出大小为13x12x11
>>> F.fractional_max_pool3d(input, 3, output_size=(13, 12, 11))
>>> # 立方窗口池化,目标输出大小为输入大小的一半
>>> F.fractional_max_pool3d(input, 3, output_ratio=(0.5, 0.5, 0.5))
优云智算