Shortcuts

QConfig

class torch.ao.quantization.qconfig.QConfig(activation, weight)[源代码]

描述了如何通过分别提供激活和权重的设置(观察者类)来量化网络的一层或部分。

请注意,QConfig 需要包含观察者(如 MinMaxObserver)或一个在调用时返回实例的可调用对象,而不是具体的观察者实例本身。量化准备函数将为每一层多次实例化观察者。

观察者类通常具有合理的默认参数,但可以使用with_args方法进行覆盖(该方法的行为类似于functools.partial):

my_qconfig = QConfig(
    activation=MinMaxObserver.with_args(dtype=torch.qint8),
    weight=default_observer.with_args(dtype=torch.qint8))
优云智算