Shortcuts

DTypeWithConstraints

class torch.ao.quantization.backend_config.DTypeWithConstraints(dtype=None, quant_min_lower_bound=None, quant_max_upper_bound=None, scale_min_lower_bound=None, scale_max_upper_bound=None, scale_exact_match=None, zero_point_exact_match=None)[源代码]

用于指定给定数据类型的附加约束的配置,例如量化值范围、比例值范围和固定量化参数,以便在 DTypeConfig中使用。

目前支持的约束条件有:

  • quant_min_lower_boundquant_max_upper_bound: 最小和最大量化值的下限和上限。如果 QConfig 的 quant_minquant_max 超出此范围,则该 QConfig 将被忽略。

  • scale_min_lower_boundscale_max_upper_bound: 最小和最大比例值的下限和上限。如果 QConfig 的最小比例值(当前作为 eps 暴露)低于下限,则该 QConfig 将被忽略。请注意,当前未强制执行上限。

  • scale_exact_matchzero_point_exact_match: 对于具有固定量化参数的算子(如sigmoid和tanh),用于比例和零点的精确匹配要求。如果QConfig中指定的观察者既不是FixedQParamsObserver也不是FixedQParamsFakeQuantize,或者量化参数不匹配,那么QConfig将被忽略。

优云智算