triton.Config¶
- class triton.Config(self, kwargs, num_warps=4, num_stages=3, num_ctas=1, maxnreg=None, pre_hook=None)¶
一个表示自动调优器可能尝试的内核配置的对象。
- Variables:
kwargs – 一个包含元参数的字典,将作为关键字参数传递给内核。
num_warps – 当为GPU编译时,用于内核的warp数量。例如,如果num_warps=8,那么每个内核实例将自动并行化,使用8 * 32 = 256个线程协同执行。
num_stages – 编译器在软件流水线循环时应使用的阶段数。主要用于SM80+ GPU上的矩阵乘法工作负载。
num_ctas – 一个块集群中的块数量。仅支持SM90+。
maxnreg – 单个线程可使用的最大寄存器数量。对应ptx的.maxnreg指令。并非所有平台都支持该参数。
pre_hook – 一个在调用内核之前会被调用的函数。该函数的参数是args。
- __init__(self, kwargs, num_warps=4, num_stages=3, num_ctas=1, maxnreg=None, pre_hook=None)¶
方法
__init__(self, kwargs[, num_warps, ...])all_kwargs(self)