1. Pascal架构调优指南
2. 修订历史
3. 通知
帕斯卡架构调优指南
»
目录
v12.8 |
PDF
|
归档
目录
涵盖NVIDIA GPU最常见问题的白皮书。
1. Pascal调优指南
1.1. NVIDIA Pascal 计算架构
1.2. CUDA 最佳实践
1.3. 应用程序兼容性
1.4. Pascal调优
1.4.1. 流式多处理器
1.4.1.1. 指令调度
1.4.1.2. 占用率
1.4.2. 新增算术原语
1.4.2.1. FP16 算术运算支持
1.4.2.2. INT8点积运算
1.4.3. 内存吞吐量
1.4.3.1. 高带宽内存2 DRAM
1.4.3.2. 统一L1/纹理缓存
1.4.4. 原子内存操作
1.4.5. 共享内存
1.4.5.1. 共享内存容量
1.4.5.2. 共享内存带宽
1.4.6. GPU间通信
1.4.6.1. NVLink 互连技术
1.4.6.2. GPUDirect RDMA带宽
1.4.7. 计算抢占
1.4.8. 统一内存改进
2. 修订历史
3. 通知
3.1. 通知
3.2. OpenCL
3.3. 商标