TensorRT Model Optimizer
入门指南
概述
安装
快速入门:量化
快速入门:量化(Windows)
快速入门:剪枝
快速入门:蒸馏
快速入门:稀疏性
指南
支持矩阵
量化
剪枝
NAS
蒸馏
Sparsity
Saving & Restoring
推测解码
部署
TensorRT-LLM 部署
DirectML 部署
示例
所有GitHub示例
ResNet20在CIFAR-10上的剪枝
HF BERT: 剪枝、蒸馏与量化
参考
更新日志
modelopt API
deploy
onnx
torch
distill
export
distribute
hf_config_map
layer_utils
mcore_config_map
model_config
model_config_export
model_config_utils
postprocess
quantization_utils
tensorrt_llm_type
tensorrt_llm_utils
transformer_engine
unified_export_hf
nas
opt
prune
quantization
稀疏性
speculative
trace
utils
支持
联系我们
常见问题解答
TensorRT Model Optimizer
modelopt API
torch
export
hf_config_map
View page source
hf_config_map
定义HF和modelopt之间的配置映射。