Logo
  • 1. 简介
  • 2. 浮点数
  • 3. 点积:一个精度示例
  • 4. CUDA与浮点运算
  • 5. 异构世界的考量因素
  • 6. 具体建议
  • 7. 致谢
  • 8. 参考文献
  • 9. 通知声明
浮点数与IEEE 754标准
  • »
  • 目录
  • v12.8 | PDF | 归档  

目录

涵盖NVIDIA GPU最常见问题的白皮书。

  • 1. 简介
  • 2. 浮点数
    • 2.1. 格式
    • 2.2. 操作与精度
    • 2.3. 融合乘加运算(FMA)
  • 3. 点积:精度示例
    • 3.1. 示例算法
    • 3.2. 对比
  • 4. CUDA与浮点运算
    • 4.1. 计算能力 2.0 及以上
    • 4.2. 舍入模式
    • 4.3. 控制融合乘加运算
    • 4.4. 编译器标志
    • 4.5. 与x86架构的差异
  • 5. 异构世界的考量因素
    • 5.1. 数学函数精度
    • 5.2. x87 和 SSE
    • 5.3. 核心数量
    • 5.4. 验证GPU结果
  • 6. 具体建议
  • 7. 致谢
  • 8. 参考文献
  • 9. 通知
    • 9.1. 通知
    • 9.2. OpenCL
    • 9.3. 商标

隐私政策 | 管理我的隐私 | 不出售或共享我的数据 | 服务条款 | 无障碍访问 | 公司政策 | 产品安全 | 联系我们

版权所有 © 2011-2025,NVIDIA Corporation & affiliates。保留所有权利。

最后更新于2025年1月21日。