base_qtensor

实数量化张量的基类。

类

`BaseQuantizedTensor`	量化张量的基类，提供量化和反量化的方法。
`QTensorWrapper`	一个用于量化张量的包装类，使其与torch.nn.Parameter兼容。

函数

将实数量化张量打包为压缩格式，并设置适当的load_state_dict函数。

class BaseQuantizedTensor

基础类：object

量化张量的基类，提供量化和反量化的方法。

这个类应该被子类化以实现特定类型的量化张量。它处理量化数据的存储以及必要的配置和原始属性。

original_meta_tensor

原始元数据以保留原始张量的属性。

quantized_data

用于存储量化张量数据的存储。Quantized_data 的数据类型根据 QuantizedTensor 的实现进行自定义。

__init__(original_shape, original_dtype, quantized_data)

初始化数据属性。

Parameters:

dequantize(dtype=None, **kwarg)

将量化张量转换回标准的 torch.Tensor。

classmethod quantize(input, block_size)

将一个假的 torch.Tensor 打包成一个真正的量化张量。

Parameters:

Returns:

一个真实的量化张量，比例。

class QTensorWrapper

基础类: Parameter

一个用于量化张量的包装类，使其与torch.nn.Parameter兼容。

static __new__(cls, qtensor)

创建一个新的 QTensorWrapper 实例。

pack_real_quantize_weight(module, force_quantize=False)

将实数量化张量打包为压缩格式，并设置适当的load_state_dict函数。