1. NVIDIA安培GPU架构调优指南
2. 修订历史
3. 通知
安培架构调优指南
»
目录
v12.8 |
PDF
|
归档
目录
1. NVIDIA安培GPU架构调优指南
1.1. NVIDIA安培GPU架构
1.2. CUDA 最佳实践
1.3. 应用程序兼容性
1.4. NVIDIA Ampere GPU架构调优
1.4.1. 流式多处理器
1.4.1.1. 占用率
1.4.1.2. 从全局内存到共享内存的异步数据拷贝
1.4.1.3. 分离到达/等待屏障的硬件加速
1.4.1.4. 归约操作的Warp级别支持
1.4.1.5. 增强的张量核心运算
1.4.1.6. 提升FP32吞吐量
1.4.2. 内存系统
1.4.2.1. 提升内存容量与高带宽内存
1.4.2.2. 增加的L2缓存容量与L2驻留控制
1.4.2.3. 统一共享内存/L1/纹理缓存
1.4.3. 第三代NVLink
2. 修订历史
3. 通知
3.1. 通知
3.2. OpenCL
3.3. 商标