QLinearConv¶
QLinearConv - 10¶
版本¶
域名:
mainsince_version:
10函数:
Falsesupport_level:
SupportType.COMMON形状推断:
True
此版本的运算符自版本10起可用。
摘要¶
卷积运算符消耗一个量化输入张量、其比例和零点、一个量化滤波器、其比例和零点,以及输出的比例和零点,并计算量化输出。每个比例和零点对必须具有相同的形状。这意味着它们必须是标量(每个张量)或一维张量(每个输出通道)。每个输入或输出及其相关的零点必须具有相同的类型。当存在偏置时,必须使用比例 = 输入比例 * 权重比例和零点为0进行量化。
属性¶
auto_pad - STRING (默认为
'NOTSET'):auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID 中的一个。默认值为 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使得
output_shape[i] = ceil(input_shape[i] / strides[i])对于每个轴i。填充在两侧均匀或几乎均匀地分配(取决于它是偶数还是奇数)。如果填充是奇数,额外的填充在 SAME_UPPER 的情况下添加到末尾,在 SAME_LOWER 的情况下添加到开头。dilations - INTS :
沿着滤波器每个空间轴的膨胀值。如果未指定,则默认每个空间轴的膨胀值为1。
group - INT (默认是
'1'):输入通道和输出通道分成的组数。默认值为1。
kernel_shape - INTS :
卷积核的形状。如果未提供,应从输入‘w’推断。
pads - INTS :
沿每个空间轴的开始和结束的填充,它可以取任何大于或等于0的值。该值表示在相应轴的开始和结束部分添加的像素数。
pads格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中xi_begin表示在轴i的开始处添加的像素数,xi_end表示在轴i的结束处添加的像素数。此属性不能与auto_pad属性同时使用。如果不存在,则沿每个空间轴的开始和结束的填充默认为0。步幅 - 整数 :
沿每个空间轴的步幅。如果未指定,则沿每个空间轴的步幅默认为1。
输入¶
在8到9个输入之间。
x(异构) - T1:
来自前一层的输入数据张量;大小为 (N x C x H x W),其中 N 是批量大小,C 是通道数,H 和 W 是高度和宽度。请注意,这是针对 2D 图像的。否则大小为 (N x C x D1 x D2 … x Dn)。可选地,如果维度表示有效,操作期望输入数据张量具有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
x_scale (异构) - tensor(float):
为输入‘x’缩放张量。它是一个标量,意味着每个张量/层的量化。
x_zero_point (异构) - T1:
输入‘x’的零点张量。它是一个标量,意味着每个张量/层的量化。
w (异构) - T2:
将在卷积中使用的权重张量;大小为 (M x C/group x kH x kW),其中 C 是通道数,kH 和 kW 是内核的高度和宽度,M 是特征图的数量。对于超过 2 维的情况,内核形状将为 (M x C/group x k1 x k2 x … x kn),其中 (k1 x k2 x … kn) 是内核的维度。可选地,如果维度表示有效,操作期望权重张量具有 [FILTER_OUT_CHANNEL, FILTER_IN_CHANNEL, FILTER_SPATIAL, FILTER_SPATIAL …] 的维度表示。X.shape[1] == (W.shape[1] * group) == C(假设形状数组的索引从零开始)。换句话说,FILTER_IN_CHANNEL 应该等于 DATA_CHANNEL。
w_scale (异构) - tensor(float):
为输入‘w’缩放张量。它可以是一个标量或一维张量,这意味着每个张量/层或每个输出通道的量化。如果它是一维张量,其元素数量应等于输出通道的数量(M)。
w_zero_point (异构) - T2:
输入‘w’的零点张量。它可以是一个标量或一维张量,这意味着每个张量/层或每个输出通道的量化。如果它是一维张量,其元素数量应等于输出通道的数量(M)。
y_scale (异构) - tensor(float):
输出‘y’的缩放张量。它是一个标量,意味着每个张量/层的量化。
y_zero_point (异构) - T3:
输出‘y’的零点张量。它是一个标量,意味着每个张量/层的量化。
B (可选, 异构) - T4:
可选的1D偏置,将被添加到卷积中,大小为M。偏置必须使用scale = x_scale * w_scale和zero_point = 0进行量化
输出¶
y (异构) - T3:
输出数据张量,包含卷积的结果。输出维度是核大小、步幅大小和填充长度的函数。
类型约束¶
T1 在 (
tensor(int8),tensor(uint8)) 中:将输入类型限制为8位整数张量。
T2 在 (
tensor(int8),tensor(uint8)) 中:将过滤器类型限制为8位整数张量。
T3 在 (
tensor(int8),tensor(uint8)):将输出类型限制为8位整数张量。
T4 在 (
tensor(int32)) 中:将偏置类型限制为32位整数张量。