1. FP4 内置函数
1.1. 用于处理e2m1类型fp4数据类型的C++结构体。
1.2. 用于处理e2m1类型四个fp4值的向量类型的C++结构体。
1.3. 用于处理e2m1类型两个fp4值的向量类型的C++结构体。
1.4. FP4转换与数据传输
2. FP6 内置函数
3. FP8 内置函数
4. 半精度内置函数
5. Bfloat16 精度内置函数
6. 单精度数学函数
7. 单精度内置函数
8. 双精度数学函数
9. 双精度内置函数
10. FP128 四精度数学函数
11. 类型转换内置函数
12. 整数数学函数
13. 整数内联函数
14. SIMD 内部函数
15. 结构体
16. 通知公告
CUDA Math API 参考手册
»
1.
FP4 内置函数
»
1.2.
用于处理e2m1类型四个fp4值的向量类型的C++结构体。
v12.8 |
PDF
|
归档
1.2.
用于处理e2m1类型四个fp4值向量结构的C++结构体。
结构体
__nv_fp4x4_e2m1
__nv_fp4x4_e2m1
数据类型