1. 适用于Tegra的CUDA
2. 概述
3. 内存管理
4. 移植注意事项
5. EGL互操作性
6. Jetson可升级CUDA软件包
7. cuDLA
8. 通知公告
CUDA for Tegra
»
目录
v12.8 |
PDF
|
归档
目录
1. 适用于Tegra的CUDA
2. 概述
3. 内存管理
3.1. I/O一致性
3.2. 估算集成GPU设备上的总可分配设备内存
4. 移植注意事项
4.1. 内存选择
4.2. 固定内存
4.3. Tegra平台上统一内存的高效使用
4.4. GPU选择
4.5. 同步机制选择
4.6. Tegra不支持的CUDA功能
5. EGL互操作性
5.1. EGLStream
5.1.1. EGLStream 数据流
5.1.2. CUDA作为生产者
5.1.3. CUDA作为消费者
5.1.4. 隐式同步
5.1.5. 生产者与消费者之间的数据传输
5.1.6. EGLStream 流水线
5.2. EGLImage
5.2.1. CUDA与EGLImage的互操作性
5.3. EGLSync
5.3.1. CUDA与EGLSync的互操作性
5.3.2. 从CUDA事件创建EGLSync
5.3.3. 从EGLSync创建CUDA事件
6. Jetson可升级的CUDA软件包
6.1. 安装CUDA升级包
6.1.1. 先决条件
6.1.2. 从网络仓库或本地安装程序获取
6.2. CUDA升级包的部署注意事项
6.2.1. 使用正确的升级包
6.2.2. 特性例外情况
6.2.3. 检查兼容性支持
7. cuDLA
7.1. 开发者指南
7.1.1. 设备模型
7.1.2. 加载与查询模块
7.1.3. 内存模型
7.1.4. 任务执行与同步模型
7.1.4.1. 任务执行
7.1.4.1.1. 多线程用户提交
7.1.4.2. 同步
7.1.4.2.1. 注册外部信号量:
7.1.4.2.2. cudlaSubmitTask()的事件设置
7.1.4.2.3. 等待信号事件
7.1.4.2.4. cuDLA中支持的同步原语
7.1.4.2.5. 在NvSciSyncAttrList中设置NvSciSyncAttrKey_RequireDeterministicFences键
7.1.4.2.6. NvSciFence的时间戳支持
7.1.4.2.7. 请求为NvSciSync对象添加时间戳支持
7.1.4.2.8. 从Fence中提取时间戳值
7.1.4.3. 故障诊断
7.1.4.4. 空操作提交
7.1.5. 错误报告模型
7.2. 从NvMediaDla迁移到cuDLA
7.3. 分析 cuDLA 应用程序
7.4. cuDLA 版本说明
8. 声明
8.1. 通知
8.2. OpenCL
8.3. 商标