Shortcuts

torch.cuda.comm.reduce_add

torch.cuda.comm.reduce_add(inputs, destination=None)[源代码]

从多个GPU中汇总张量。

所有输入应具有匹配的形状、数据类型和布局。输出张量的形状、数据类型和布局将与输入相同。

Parameters
  • 输入 (可迭代对象[Tensor]) – 要相加的张量的可迭代对象。

  • 目标设备 (int, 可选) – 输出将被放置的设备(默认值:当前设备)。

Returns

包含所有输入元素逐项求和的张量,放置在 目标设备上。