Logo
  • 1. Pascal架构调优指南
  • 2. 修订历史
  • 3. 通知
帕斯卡架构调优指南
  • »
  • 目录
  • v12.8 | PDF | 归档  

目录

涵盖NVIDIA GPU最常见问题的白皮书。

  • 1. Pascal调优指南
    • 1.1. NVIDIA Pascal 计算架构
    • 1.2. CUDA 最佳实践
    • 1.3. 应用程序兼容性
    • 1.4. Pascal调优
      • 1.4.1. 流式多处理器
        • 1.4.1.1. 指令调度
        • 1.4.1.2. 占用率
      • 1.4.2. 新增算术原语
        • 1.4.2.1. FP16 算术运算支持
        • 1.4.2.2. INT8点积运算
      • 1.4.3. 内存吞吐量
        • 1.4.3.1. 高带宽内存2 DRAM
        • 1.4.3.2. 统一L1/纹理缓存
      • 1.4.4. 原子内存操作
      • 1.4.5. 共享内存
        • 1.4.5.1. 共享内存容量
        • 1.4.5.2. 共享内存带宽
      • 1.4.6. GPU间通信
        • 1.4.6.1. NVLink 互连技术
        • 1.4.6.2. GPUDirect RDMA带宽
      • 1.4.7. 计算抢占
      • 1.4.8. 统一内存改进
  • 2. 修订历史
  • 3. 通知
    • 3.1. 通知
    • 3.2. OpenCL
    • 3.3. 商标

隐私政策 | 管理我的隐私 | 不出售或共享我的数据 | 服务条款 | 无障碍访问 | 公司政策 | 产品安全 | 联系我们

版权所有 © 2016-2025,NVIDIA公司及附属机构。保留所有权利。

最后更新于2025年1月21日。