量化

模块

modelopt.torch.quantization.calib

校准器类。

modelopt.torch.quantization.config

本文档列出了Model Optimizer支持的量化格式以及示例量化配置。

modelopt.torch.quantization.conversion

量化转换/恢复工具。

modelopt.torch.quantization.export_onnx

用于将量化后的torch模型导出为量化ONNX的工具。

modelopt.torch.quantization.extensions

加载C++ / CUDA扩展的模块。

modelopt.torch.quantization.mode

此模块包含量化模式的模式描述符。

modelopt.torch.quantization.model_calib

校准工具。

modelopt.torch.quantization.model_quant

面向用户的量化API。

modelopt.torch.quantization.nn

支持量化的模块。

modelopt.torch.quantization.optim

已弃用。

modelopt.torch.quantization.plugins

处理量化插件以正确量化第三方模块。

modelopt.torch.quantization.qtensor

用于实际量化的张量类。

modelopt.torch.quantization.quant_modules

已弃用。

modelopt.torch.quantization.tensor_quant

基本的张量量化函数。

modelopt.torch.quantization.utils

量化工具。

量化包。