矩阵反演——用于深度学习的线性代数（下）

在本文中，我们将介绍矩阵反演，并阐述其在线性代数中的重要性。矩阵反演的概念源于解联立线性方程的需求，在许多应用科学领域中都需要求解联立线性方程，如物理学、工程学和量化金融等。矩阵反演作为一种技术能够帮助我们解决这些问题，因此成为统计学和机器学习中的一种关键方法，特别是在线性回归中的普通最小二乘估计的求解中。

联立线性方程让我们从一组线性联立方程的示例开始：

通常的目标是找到满足这些方程的x、y和z的值。在上述只有三个方程的情况下，一些相对简单的代数操作将提供答案。然而，一旦方程的数量显著增加，以这种方式编写方程可能会变得不方便。

另一种选择是使用矩阵。

这就是矩阵反演的基本思想。我们可以使用矩阵逆来求解线性方程组，而不需要手动求解每个未知数。然而，需要注意的是，并非所有的矩阵都有逆矩阵。如果矩阵没有逆矩阵，那么这种方法就不能使用。

克罗内克δ函数和单位矩阵

克罗内克δ函数是一种具有两个变量 i 和 j 的数学函数：当 i 和 j 相等时，克罗内克δ等于 1，否则为零。

该函数可以用于定义一个新的方阵，其中矩阵中位置 i，j 处的每个元素都等于克罗内克δ的值：

这种类型的矩阵被称为 n 阶单位矩阵。单位矩阵具有一个独特的性质，即当它左乘或右乘任何矩阵 A 时，它保持 A 不变——

现在我们可以定义矩阵 A的逆矩阵为：

矩阵反演算法

常用的找到矩阵逆矩阵（如果存在）的方法是使用高斯消去法。然而，对于一个大的n*n维矩阵，这种方法是一种昂贵且低效的逆运算机制。该操作成本与矩阵大小成正比，即其算术复杂度为O（n^3）。如果需要执行许多这样的逆运算，这可能是一个严重的问题。对于应用于科学、定量金融和深度学习等领域的大多数应用，将解x近似到某个公差范围内就足够了，而不是直接求得精确值。因此，许多计算量较小的算法已足以提供必要的精度。这些算法可以是高斯-乔丹消去法的优化版本，针对特别结构化的矩阵，也可以使用迭代方法，在有限的迭代次数中将x逼近到一定的精度。这些算法的目标是有效地近似解决上述矩阵方程中的x。这种需求导致了数值线性代数这一数学子领域的发展。

矩阵反演——用于深度学习的线性代数（下）

评论