1. FP4 内置函数

本节介绍fp4内置函数。

要使用这些函数,请在程序中包含头文件cuda_fp4.h

以下宏可用于帮助用户选择性启用/禁用头文件中的各种定义:

  • __CUDA_NO_FP4_CONVERSIONS__ - 如果定义了这个宏,将阻止使用头文件中定义的C++类型转换(转换构造函数和转换运算符)。

  • __CUDA_NO_FP4_CONVERSION_OPERATORS__ - 如果定义了这个宏,将阻止从fp4到其他类型的C++转换运算符的使用。

注意

这里定义的大多数操作在针对特定GPU目标(例如计算能力10.0a的设备)进行编译时,都能受益于原生硬件支持,其他目标则使用模拟路径。

群组