工具

量化工具。

函数

`reduce_amax`	计算张量的绝对最大值。
`is_quantized`	检查模块是否被量化。
`is_quantized_layer_with_weight`	检查模块是否使用权重进行了量化。
`is_quantized_column_parallel_linear`	检查模块是否为量化列并行线性模块。
`is_quantized_row_parallel_linear`	检查模块是否为量化的行并行线性模块。
`replace_function`	在上下文中用新函数替换一个函数。
`export_torch_mode`	上下文管理器启用导出模式。
`is_torch_library_supported`	检查已安装的PyTorch版本是否满足或超过指定版本。
`get_parallel_state`	获取并行状态。

get_parallel_state(model, name=None)

获取并行状态。

Parameters:

Return type:

并行状态

reduce_amax(input, axis=None, keepdims=True)

计算张量的绝对最大值。

沿着axis中给定的维度减少input_tensor。除非keepdims为真，否则对于axis中的每个条目，张量的秩都会减少1。如果keepdims为真，则减少的维度将保留长度为1。

注意

梯度计算被禁用，因为此函数从不意味着学习会减少 amax

Parameters:

input – 输入张量
axis – 要减少的维度。可以是None、int或int的元组。如果为None（默认值），则减少所有维度。必须在[-rank(input_tensor), rank(input_tensor))范围内。
keepdims – 一个布尔值。如果为真，则保留长度为1的缩减维度。默认为True
granularity – 已弃用。指定统计量是在张量还是通道粒度上计算

Returns:

简化后的张量。

Raises: