triton.language¶
编程模型¶
表示一个N维的值数组或指针数组。 |
|
返回当前程序实例沿给定 |
|
返回沿给定 |
创建操作¶
返回半开区间 |
|
连接给定的块 |
|
返回一个根据给定的 |
|
返回一个用标量值0填充的张量,根据给定的 |
|
返回一个与给定张量形状和类型相同的全零张量。 |
|
将张量转换为指定的 |
形状操作运算¶
尝试将给定的两个块广播到一个共同的兼容形状。 |
|
尝试将给定的张量广播到新的 |
|
通过插入新的长度为1的维度来扩展张量的形状。 |
|
沿着最后一个维度交错两个张量的值。 |
|
在新增的次要维度上连接给定的张量。 |
|
对张量的维度进行排列。 |
|
返回 |
|
返回一个与输入元素数量相同但具有指定形状的张量。 |
|
沿着张量的最后一个维度将其分成两部分,该维度的大小必须为2。 |
|
对张量的维度进行排列。 |
|
返回一个与input具有相同元素但形状不同的张量。 |
线性代数运算¶
返回两个块的矩阵乘积。 |
|
返回微缩格式下两个矩阵块的矩阵乘积。 |
内存/指针操作¶
返回一个数据张量,其值从由pointer定义的内存位置加载: |
|
将数据张量存储到由pointer定义的内存位置中。 |
|
返回指向父张量中某块的指针 |
|
推进块指针 |
索引操作¶
沿维度dim翻转张量x。 |
|
根据 |
|
将行优先size_i * size_j矩阵的索引转换为每组size_g行的列优先矩阵索引。 |
数学运算¶
计算 |
|
计算 |
|
计算 |
|
将输入张量 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
归约操作¶
返回沿指定 |
|
返回沿指定 |
|
返回沿指定 |
|
返回 |
|
将combine_fn应用于 |
|
返回 |
|
返回 |
扫描/排序操作¶
将combine_fn应用于 |
|
返回 |
|
返回 |
|
基于输入张量计算具有num_bins个分箱的直方图,分箱宽度为1且从0开始。 |
|
沿给定维度从张量中收集数据。 |
原子操作¶
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
随机数生成¶
给定一个 |
|
给定一个 |
|
给定一个 |
|
给定一个 |
迭代器¶
一个永远向上计数的迭代器。 |
|
一个永远向上计数的迭代器。 |
内联汇编¶
在张量上执行内联汇编。 |
编译器提示操作¶
允许编译器假设 |
|
插入一个屏障来同步块中的所有线程。 |
|
让编译器知道 |
|
让编译器知道 |
|
让编译器知道 |
调试操作¶
在编译时打印值。 |
|
在编译时断言条件。 |
|
在运行时从设备打印数值。 |
|
在设备运行时断言条件。 |