5.4 矩阵的梯度 接下来我们将会看见需要求矩阵对向量(或其他矩阵)的梯度的情形。它们的结果是一个多维度的张量(tensor),我们可以将其看做装有偏导数的多维数组。例如,如果我们计算一个 $m \times n$ 形状的矩阵 $\boldsymbol{A}$ 对 $p \times q$ 形状的矩阵 $\boldsymbol{B}$ 的梯度,结果Jacobian 矩阵的形状将是 $(m \times n) \times (p \times q)$,即一个四维张量 $\boldsymbol{J}$,它的每个分量可以写为 $\boldsymbol{J}{i,j,k,l} = \displaystyle \frac{ \partial \boldsymbol{A}{i,j} }{