1. 简介
2. 浮点数
3. 点积:一个精度示例
4. CUDA与浮点运算
5. 异构世界的考量因素
6. 具体建议
7. 致谢
8. 参考文献
9. 通知声明
浮点数与IEEE 754标准
»
目录
v12.8 |
PDF
|
归档
目录
涵盖NVIDIA GPU最常见问题的白皮书。
1. 简介
2. 浮点数
2.1. 格式
2.2. 操作与精度
2.3. 融合乘加运算(FMA)
3. 点积:精度示例
3.1. 示例算法
3.2. 对比
4. CUDA与浮点运算
4.1. 计算能力 2.0 及以上
4.2. 舍入模式
4.3. 控制融合乘加运算
4.4. 编译器标志
4.5. 与x86架构的差异
5. 异构世界的考量因素
5.1. 数学函数精度
5.2. x87 和 SSE
5.3. 核心数量
5.4. 验证GPU结果
6. 具体建议
7. 致谢
8. 参考文献
9. 通知
9.1. 通知
9.2. OpenCL
9.3. 商标