torch.cuda.comm.reduce_add¶ torch.cuda.comm.reduce_add(inputs, destination=None)[源代码]¶ 从多个GPU中汇总张量。 所有输入应具有匹配的形状、数据类型和布局。输出张量的形状、数据类型和布局将与输入相同。 Parameters 输入 (可迭代对象[Tensor]) – 要相加的张量的可迭代对象。 目标设备 (int, 可选) – 输出将被放置的设备(默认值:当前设备)。 Returns 包含所有输入元素逐项求和的张量,放置在 目标设备上。