1. FP4 内置函数
2. FP6 内置函数
3. FP8 内置函数
3.1. 用于处理e4m3类型fp8数据类型的C++结构体。
3.2. 用于处理e5m2类型fp8数据类型的C++结构体。
3.3. 用于处理e4m3类型四个fp8值的向量类型的C++结构体。
3.4. 用于处理e5m2类型四个fp8值的向量类型的C++结构体。
3.5. 用于处理e8m0类型四个缩放因子向量类型的C++结构体。
3.6. 用于处理e4m3类型两个fp8值的向量类型的C++结构体。
3.7. 用于处理e5m2类型两个fp8值的向量类型的C++结构体。
3.8. 用于处理e8m0类型双缩放因子向量类型的C++结构体。
3.9. FP8转换与数据传输
4. 半精度内置函数
5. Bfloat16 精度内置函数
6. 单精度数学函数
7. 单精度内置函数
8. 双精度数学函数
9. 双精度内置函数
10. FP128 四精度数学函数
11. 类型转换内置函数
12. 整数数学函数
13. 整数内联函数
14. SIMD 内部函数
15. 结构体
16. 通知公告
CUDA Math API 参考手册
»
3.
FP8 内置函数
»
3.5.
用于处理e8m0类型四个缩放因子向量类型的C++结构体。
v12.8 |
PDF
|
归档
3.5.
用于处理e8m0类型四比例因子向量类型的C++结构体
结构体
__nv_fp8x4_e8m0
__nv_fp8x4_e8m0
数据类型