FusedMovingAvgObsFakeQuantize¶
- class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[源代码]¶
定义一个融合模块来观察张量。
融合模块,用于观察输入张量(计算最小值/最大值),计算缩放/零点并进行伪量化处理。 该模块使用类似于MovingAverageMinMaxObserver的计算方法来处理输入, 以计算最小值/最大值,从而计算缩放/零点。 观察器中的qscheme输入用于区分对称/仿射量化方案。
该模块的输出由以下公式给出: x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale
类似于
FakeQuantize,并接受与基类相同的属性。