Shortcuts

torch.sparse.mm

torch.sparse.mm()

对稀疏矩阵 mat1 和(稀疏或密集)矩阵 mat2 进行矩阵乘法。类似于 torch.mm(),如果 mat1 是一个 (n×m)(n \times m) 张量,mat2 是一个 (m×p)(m \times p) 张量,输出将是一个 (n×p)(n \times p) 张量。 当 mat1 是 COO 张量时,它必须有 sparse_dim = 2。 当输入是 COO 张量时,此函数还支持两个输入的反向传播。

支持CSR和COO存储格式。

注意

此函数不支持对CSR矩阵进行导数计算。

此函数还额外接受一个可选的 reduce 参数,该参数允许指定一个可选的归约操作,在数学上执行以下操作:

zij=k=0K1xikykjz_{ij} = \bigoplus_{k = 0}^{K - 1} x_{ik} y_{kj}

其中 \bigoplus 定义了归约运算符。reduce 仅在 CPU 设备的 CSR 存储格式上实现。

Parameters
  • mat1 (张量) – 要相乘的第一个稀疏矩阵

  • mat2 (张量) – 要相乘的第二个矩阵,可以是稀疏或稠密

  • reduce (str, optional) – 对非唯一索引应用的归约操作 ("sum", "mean", "amax", "amin")。默认值为 "sum"

Shape:

该函数的输出张量格式如下: - 稀疏 x 稀疏 -> 稀疏 - 稀疏 x 密集 -> 密集

示例:

>>> a = torch.tensor([[1., 0, 2], [0, 3, 0]]).to_sparse().requires_grad_()
>>> a
tensor(indices=tensor([[0, 0, 1],
                       [0, 2, 1]]),
       values=tensor([1., 2., 3.]),
       size=(2, 3), nnz=3, layout=torch.sparse_coo, requires_grad=True)
>>> b = torch.tensor([[0, 1.], [2, 0], [0, 0]], requires_grad=True)
>>> b
tensor([[0., 1.],
        [2., 0.],
        [0., 0.]], requires_grad=True)
>>> y = torch.sparse.mm(a, b)
>>> y
tensor([[0., 1.],
        [6., 0.]], grad_fn=)
>>> y.sum().backward()
>>> a.grad
tensor(indices=tensor([[0, 0, 1],
                       [0, 2, 1]]),
       values=tensor([1., 0., 2.]),
       size=(2, 3), nnz=3, layout=torch.sparse_coo)
>>> c = a.detach().to_sparse_csr()
>>> c
tensor(crow_indices=tensor([0, 2, 3]),
       col_indices=tensor([0, 2, 1]),
       values=tensor([1., 2., 3.]), size=(2, 3), nnz=3,
       layout=torch.sparse_csr)
>>> y1 = torch.sparse.mm(c, b, 'sum')
>>> y1
tensor([[0., 1.],
        [6., 0.]], grad_fn=)
>>> y2 = torch.sparse.mm(c, b, 'max')
>>> y2
tensor([[0., 1.],
        [6., 0.]], grad_fn=)