目录
- 1. 简介
- 2. 使用cuBLAS API
- 2.1. 概述
- 2.2. cuBLAS 数据类型参考
- 2.3. CUDA 数据类型参考
- 2.4. cuBLAS 辅助函数参考
- 2.4.1. cublasCreate()
- 2.4.2. cublasDestroy()
- 2.4.3. cublasGetVersion()
- 2.4.4. cublasGetProperty()
- 2.4.5. cublasGetStatusName()
- 2.4.6. cublasGetStatusString()
- 2.4.7. cublasSetStream()
- 2.4.8. cublasSetWorkspace()
- 2.4.9. cublasGetStream()
- 2.4.10. cublasGetPointerMode()
- 2.4.11. cublasSetPointerMode()
- 2.4.12. cublasSetVector()
- 2.4.13. cublasGetVector()
- 2.4.14. cublasSetMatrix()
- 2.4.15. cublasGetMatrix()
- 2.4.16. cublasSetVectorAsync()
- 2.4.17. cublasGetVectorAsync()
- 2.4.18. cublasSetMatrixAsync()
- 2.4.19. cublasGetMatrixAsync()
- 2.4.20. cublasSetAtomicsMode()
- 2.4.21. cublasGetAtomicsMode()
- 2.4.22. cublasSetMathMode()
- 2.4.23. cublasGetMathMode()
- 2.4.24. cublasSetSmCountTarget()
- 2.4.25. cublasGetSmCountTarget()
- 2.4.26. cublasLoggerConfigure()
- 2.4.27. cublasGetLoggerCallback()
- 2.4.28. cublasSetLoggerCallback()
- 2.5. cuBLAS Level-1 函数参考
- 2.6. cuBLAS Level-2 函数参考
- 2.6.1. cublas
gbmv() - 2.6.2. cublas
gemv() - 2.6.3. cublas
ger() - 2.6.4. cublas
sbmv() - 2.6.5. cublas
spmv() - 2.6.6. cublas
spr() - 2.6.7. cublas
spr2() - 2.6.8. cublas
symv() - 2.6.9. cublas
syr() - 2.6.10. cublas
syr2() - 2.6.11. cublas
tbmv() - 2.6.12. cublas
tbsv() - 2.6.13. cublas
tpmv() - 2.6.14. cublas
tpsv() - 2.6.15. cublas
trmv() - 2.6.16. cublas
trsv() - 2.6.17. cublas
hemv() - 2.6.18. cublas
hbmv() - 2.6.19. cublas
hpmv() - 2.6.20. cublas
her() - 2.6.21. cublas
her2() - 2.6.22. cublas
hpr() - 2.6.23. cublas
hpr2() - 2.6.24. cublas
gemvBatched() - 2.6.25. cublas
gemvStridedBatched()
- 2.6.1. cublas
- 2.7. cuBLAS Level-3 函数参考
- 2.7.1. cublas
gemm() - 2.7.2. cublas
gemm3m() - 2.7.3. cublas
gemmBatched() - 2.7.4. cublas
gemmStridedBatched() - 2.7.5. cublas
gemmGroupedBatched() - 2.7.6. cublas
symm() - 2.7.7. cublas
syrk() - 2.7.8. cublas
syr2k() - 2.7.9. cublas
syrkx() - 2.7.10. cublas
trmm() - 2.7.11. cublas
trsm() - 2.7.12. cublas
trsmBatched() - 2.7.13. cublas
hemm() - 2.7.14. cublas
herk() - 2.7.15. cublas
her2k() - 2.7.16. cublas
herkx()
- 2.7.1. cublas
- 2.8. 类BLAS扩展
- 2.8.1. cublas
geam() - 2.8.2. cublas
dgmm() - 2.8.3. cublas
getrfBatched() - 2.8.4. cublas
getrsBatched() - 2.8.5. cublas
getriBatched() - 2.8.6. cublas
matinvBatched() - 2.8.7. cublas
geqrfBatched() - 2.8.8. cublas
gelsBatched() - 2.8.9. cublas
tpttr() - 2.8.10. cublas
trttp() - 2.8.11. cublas
gemmEx() - 2.8.12. cublasGemmEx()
- 2.8.13. cublasGemmBatchedEx()
- 2.8.14. cublasGemmStridedBatchedEx()
- 2.8.15. cublasGemmGroupedBatchedEx()
- 2.8.16. cublasCsyrkEx()
- 2.8.17. cublasCsyrk3mEx()
- 2.8.18. cublasCherkEx()
- 2.8.19. cublasCherk3mEx()
- 2.8.20. cublasNrm2Ex()
- 2.8.21. cublasAxpyEx()
- 2.8.22. cublasDotEx()
- 2.8.23. cublasRotEx()
- 2.8.24. cublasScalEx()
- 2.8.1. cublas
- 3. 使用cuBLASLt API
- 3.1. 概述
- 3.2. cuBLASLt 代码示例
- 3.3. cuBLASLt 数据类型参考
- 3.3.1. cublasLtClusterShape_t
- 3.3.2. cublasLtEpilogue_t
- 3.3.3. cublasLtHandle_t
- 3.3.4. cublasLtLoggerCallback_t
- 3.3.5. cublasLtMatmulAlgo_t
- 3.3.6. cublasLtMatmulAlgoCapAttributes_t
- 3.3.7. cublasLtMatmulAlgoConfigAttributes_t
- 3.3.8. cublasLtMatmulDesc_t
- 3.3.9. cublasLtMatmulDescAttributes_t
- 3.3.10. cublasLtMatmulHeuristicResult_t
- 3.3.11. cublasLtMatmulInnerShape_t
- 3.3.12. cublasLtMatmulPreference_t
- 3.3.13. cublasLtMatmulPreferenceAttributes_t
- 3.3.14. cublasLtMatmulSearch_t
- 3.3.15. cublasLtMatmulTile_t
- 3.3.16. cublasLtMatmulStages_t
- 3.3.17. cublasLtNumericalImplFlags_t
- 3.3.18. cublasLtMatrixLayout_t
- 3.3.19. cublasLtMatrixLayoutAttribute_t
- 3.3.20. cublasLtMatrixTransformDesc_t
- 3.3.21. cublasLtMatrixTransformDescAttributes_t
- 3.3.22. cublasLtOrder_t
- 3.3.23. cublasLtPointerMode_t
- 3.3.24. cublasLtPointerModeMask_t
- 3.3.25. cublasLtReductionScheme_t
- 3.3.26. cublasLtMatmulMatrixScale_t
- 3.4. cuBLASLt API 参考文档
- 3.4.1. cublasLtCreate()
- 3.4.2. cublasLtDestroy()
- 3.4.3. cublasLtDisableCpuInstructionsSetMask()
- 3.4.4. cublasLtGetCudartVersion()
- 3.4.5. cublasLtGetProperty()
- 3.4.6. cublasLtGetStatusName()
- 3.4.7. cublasLtGetStatusString()
- 3.4.8. cublasLtHeuristicsCacheGetCapacity()
- 3.4.9. cublasLtHeuristicsCacheSetCapacity()
- 3.4.10. cublasLtGetVersion()
- 3.4.11. cublasLtLoggerSetCallback()
- 3.4.12. cublasLtLoggerSetFile()
- 3.4.13. cublasLtLoggerOpenFile()
- 3.4.14. cublasLtLoggerSetLevel()
- 3.4.15. cublasLtLoggerSetMask()
- 3.4.16. cublasLtLoggerForceDisable()
- 3.4.17. cublasLtMatmul()
- 3.4.18. cublasLtMatmulAlgoCapGetAttribute()
- 3.4.19. cublasLtMatmulAlgoCheck()
- 3.4.20. cublasLtMatmulAlgoConfigGetAttribute()
- 3.4.21. cublasLtMatmulAlgoConfigSetAttribute()
- 3.4.22. cublasLtMatmulAlgoGetHeuristic()
- 3.4.23. cublasLtMatmulAlgoGetIds()
- 3.4.24. cublasLtMatmulAlgoInit()
- 3.4.25. cublasLtMatmulDescCreate()
- 3.4.26. cublasLtMatmulDescInit()
- 3.4.27. cublasLtMatmulDescDestroy()
- 3.4.28. cublasLtMatmulDescGetAttribute()
- 3.4.29. cublasLtMatmulDescSetAttribute()
- 3.4.30. cublasLtMatmulPreferenceCreate()
- 3.4.31. cublasLtMatmulPreferenceInit()
- 3.4.32. cublasLtMatmulPreferenceDestroy()
- 3.4.33. cublasLtMatmulPreferenceGetAttribute()
- 3.4.34. cublasLtMatmulPreferenceSetAttribute()
- 3.4.35. cublasLtMatrixLayoutCreate()
- 3.4.36. cublasLtMatrixLayoutInit()
- 3.4.37. cublasLtMatrixLayoutDestroy()
- 3.4.38. cublasLtMatrixLayoutGetAttribute()
- 3.4.39. cublasLtMatrixLayoutSetAttribute()
- 3.4.40. cublasLtMatrixTransform()
- 3.4.41. cublasLtMatrixTransformDescCreate()
- 3.4.42. cublasLtMatrixTransformDescInit()
- 3.4.43. cublasLtMatrixTransformDescDestroy()
- 3.4.44. cublasLtMatrixTransformDescGetAttribute()
- 3.4.45. cublasLtMatrixTransformDescSetAttribute()
- 4. 使用cuBLASXt API
- 5. 使用 cuBLASDx API
- 6. 使用cuBLAS传统API
- 7. cuBLAS Fortran绑定
- 8. 与其他库和工具的交互
- 9. 致谢
- 10. 通知