nvfp4_tensor

实现NVFP4量化，用于高效的张量存储和计算。

类

未实现。

class NVFP4QTensor

基础类: BaseQuantizedTensor

未实现。

dequantize(dtype=torch.float16, **kwarg)

未实现。

classmethod get_weights_scaling_factor(input, block_size, weights_scaling_factor_2=None, keep_high_precision=False)

未实现。

Parameters:

classmethod get_weights_scaling_factor_2(input)

未实现。

classmethod quantize(input, block_size, weights_scaling_factor=None, weights_scaling_factor_2=None, keep_high_precision=False)

未实现。

Parameters:

classmethod resmooth_weights_and_get_scales(merged_weights, pre_quant_scales, ranks, group_size, avg_pre_quant_scale=None)

未实现。

Parameters: