1. 简介
2. 入门指南
3. 用户界面
4. 语言
5. 基本用法
6. 预编译头文件 (CUDA 12.8+)
7. 访问降级名称
8. 与模板主机代码接口
9. 版本控制方案
10. 其他注意事项
11. 示例:SAXPY
12. 示例:使用Lowered Name
13. 示例:使用nvrtcGetTypeName
14. 示例:动态并行
15. 示例:设备LTO(链接时优化)
16. 示例:自动PCH (CUDA 12.8+)
17. 示例:显式PCH创建与使用(CUDA 12.8+)
18. 示例:PCH堆大小调整(CUDA 12.8+)
NVRTC
»
目录
v12.8 |
PDF
|
归档
目录
1. 简介
2. 入门指南
2.1. 系统要求
2.2. 安装
3. 用户界面
3.1. 错误处理
3.1.1. 枚举类型
3.1.2. 函数
3.2. 通用信息查询
3.2.1. 函数
3.3. 编译
3.3.1. 函数
3.3.2. 类型定义
3.4. 支持的编译选项
3.5. 预编译头文件(PCH) (CUDA 12.8+)
3.5.1. 函数
3.6. 主机辅助工具
3.6.1. 函数
4. 语言
4.1. 执行空间
4.2. 独立编译
4.3. 动态并行
4.4. 整数大小
4.5. 包含语法
4.6. 预定义宏
4.7. 预定义类型
4.8. 内置函数
4.9. 默认C++方言
5. 基础用法
6. 预编译头文件 (CUDA 12.8+)
6.1. 概述
6.2. 实现概述
6.3. 自动PCH
6.4. 显式PCH创建与使用
6.5. 确定
头部停止
点
6.6. PCH故障条件
6.7. PCH堆控制
6.8. 其他控制项
6.8.1. 环境变量
6.8.2. 编译指示
6.8.3. 标志位
6.8.4. 创建PCH前的模板实例化
7. 访问降级名称
7.1. 示例
7.2. 说明
8. 与模板主机代码接口
8.1. 模板主机代码示例
9. 版本控制方案
9.1. NVRTC共享库版本管理
9.2. NVRTC内置函数库
10. 其他注意事项
10.1. 线程安全性
10.2. 堆栈大小
10.3. NVRTC静态库
11. 示例:SAXPY
11.1. 代码 (saxpy.cpp)
11.2. Saxpy 构建指南
12. 示例:使用Lowered名称
12.1. 代码 (lowered-name.cpp)
12.2. 降级名称构建指令
13. 示例:使用nvrtcGetTypeName
13.1. 代码 (host-type-name.cpp)
13.2. nvrtcGetTypeName 构建说明
14. 示例:动态并行
14.1. 动态并行性构建说明
15. 示例:设备LTO(链接时优化)
15.1. 代码 (offline.cu)
15.2. 代码 (online.cpp)
15.3. 设备LTO构建指南
16. 示例:自动PCH(CUDA 12.8+)
16.1. 代码 (auto_pch_common.h)
16.2. 代码 (auto_pch.cpp)
16.3. 自动PCH构建说明
17. 示例:显式PCH创建与使用(CUDA 12.8+)
17.1. 代码 (common.h)
17.2. 代码 (explicit_pch.cpp)
17.3. 显式PCH构建说明
18. 示例:PCH堆大小调整(CUDA 12.8+)
18.1. 代码 (auto_pch_common.h)
18.2. 代码 (pch_resize.cpp)
18.3. PCH堆大小调整构建说明
18.4. 通知公告
18.4.1. 通知
18.4.2. OpenCL
18.4.3. 商标