NVIDIA cuFFTDx¶
cuFFT设备扩展库(cuFFTDx)允许您在CUDA内核中执行快速傅里叶变换(FFT)计算。将FFT与其他操作融合可以降低延迟并提高应用程序性能。
cuFFTDx 是 MathDx 工具包的一部分,该工具包还包含提供选定线性代数函数(如通用矩阵乘法 GEMM)的 cuBLASDx 库。这两个库设计为协同工作。工具包中包含的 cuBLASDx 示例展示了同时使用这两个库的内核实现。在单个项目中使用多个设备扩展库时,它们都应来自同一版本的 MathDx 发布包。
文档包含三个主要组成部分:
快速入门指南,First FFT Using cuFFTDx。
一份cuFFTDx API参考,全面概述了所提供的功能。
亮点¶
cuFFTDx库提供以下功能:
可嵌入CUDA内核的快速傅里叶变换(FFT) CUDA函数。
高性能,无需在全局内存之间进行不必要的数据传输。
可定制性,提供调整FFT例程选择的选项以满足不同需求(如大小、精度、批量数量等)。
能够将FFT内核与其他操作融合,以减少全局内存访问次数。
与未来版本的CUDA工具包兼容。