模型校准
校准工具。
函数
使用max校准模型。 |
|
如果提供了additonal_algorithm,则校准模型,然后应用实际量化。 |
|
将AWQ应用于模型。 |
|
具有每通道权重缩放的Smooth-Quant变体。 |
- awq(model, algorithm='awq_lite', forward_loop=None, **kwargs)
将AWQ应用于模型。
- Parameters:
模型 (模块) –
algorithm (str) –
forward_loop (Callable[[Module], None] | None) –
- max_calibrate(model, forward_loop=None)
使用max校准模型。
- Parameters:
模型 (模块) –
forward_loop (Callable[[Module], None] | None) –
- real_quantize(model, forward_loop=None, **kwargs)
如果提供了additonal_algorithm,则校准模型,然后应用实际量化。
- Parameters:
模型 (模块) –
forward_loop (Callable[[Module], None] | None) –
- smoothquant(model, forward_loop=None, alpha=1.0)
具有每通道权重缩放的Smooth-Quant变体。
参数如
SmoothQuantCalibConfig中所述。- Parameters:
模型 (模块) –
forward_loop (Callable[[Module], None] | None) –