Logo
  • 1. NVIDIA Hopper 调优指南
  • 2. 修订历史
  • 3. 通知
Hopper调优指南
  • »
  • 目录
  • v12.8 | PDF | 归档  

目录

  • 1. NVIDIA Hopper调优指南
    • 1.1. NVIDIA Hopper GPU架构
    • 1.2. CUDA 最佳实践
    • 1.3. 应用程序兼容性
    • 1.4. NVIDIA Hopper调优
      • 1.4.1. 流式多处理器
        • 1.4.1.1. 占用率
        • 1.4.1.2. 张量内存加速器
        • 1.4.1.3. 线程块集群
        • 1.4.1.4. 提升的FP32吞吐量
        • 1.4.1.5. 动态编程指令
      • 1.4.2. 内存系统
        • 1.4.2.1. 高带宽内存HBM3子系统
        • 1.4.2.2. 增加的L2缓存容量
        • 1.4.2.3. 内联压缩
        • 1.4.2.4. 统一共享内存/L1/纹理缓存
      • 1.4.3. 第四代NVLink
  • 2. 修订历史
  • 3. 通知
    • 3.1. 通知
    • 3.2. OpenCL
    • 3.3. 商标

隐私政策 | 管理我的隐私 | 不出售或共享我的数据 | 服务条款 | 无障碍访问 | 公司政策 | 产品安全 | 联系我们

版权所有 © 2022-2025,NVIDIA公司及其附属公司。保留所有权利。

最后更新于2025年1月21日。