Linear Algebra-投影矩阵与最小二乘-16

一、知识概要

上一节我们学习了投影的基本概念,今天让我们把这个概念应用到一个非常实用的问题上——最小二乘法。其实你会发现,最小二乘法在本质上就是一种投影,它的目标就是找到使得误差最小的解。

本文涉及到矩阵列空间与左零空间的密切关系:向量的投影本质上就是在列空间中寻找距离原向量最近的点,而这个过程正好就是最小二乘法的核心思想。我们还会在此基础上引出标准正交向量组的概念,为后续内容做好铺垫。

二、投影矩阵回顾

上一节我们得到了投影矩阵 ,其公式为:

当时推导这个公式时,我们假设 ,其中 是平面上的两个基向量,此时 的列空间就是整个 平面。当我们计算 时,其实就是把向量 投影到 的列空间中,得到列空间中距离 最近的点。

现在,让我们通过两个典型问题来加深对投影矩阵性质的理解:

  1. 在矩阵 的列空间里,则

    此时答案是:。因为 本身就在 的列空间中,它在列空间中最近的点就是它自己,所以投影自然就是它本身。

    • 证明过程
      • 由于 的列空间里,所以一定可以写成 的形式。
      • 将其代入投影矩阵可得:,根据矩阵乘法结合律,,而 ,所以 ,又因为 ,所以
  2. 垂直于 的列空间,则

    此时答案是:,即投影结果为零向量。想象一下,如果一个向量本身就垂直于平面,那么它在平面上根本就没有分量,投影自然就是零向量。

    • 证明过程
      • 因为 垂直于 的列空间,所以 垂直于 的所有列向量,那么 必然在左零空间中。
      • 代入投影矩阵公式:,由于 在左零空间,所以 ,则

通过这两个问题,我们可以总结出投影矩阵的核心作用:任意一个向量 都可以分解为两个正交分量,一个分量在 的列空间中,另一个分量垂直于 的列空间。投影矩阵的作用就是保留列空间中的分量,去除垂直于列空间的分量。

我们可以用公式 表示这种分解关系,其中 是投影矩阵作用于 上得到的向量, 是左零空间中的分量。如果用类似投影矩阵表示,有:

这里有意思的一点是: 本身也可以看作一个投影矩阵,它将向量 投影到左零空间中,正好和 分工合作,把向量分到两个正交的子空间中。

Linear_Algebra160

这个分解关系非常重要,它是我们理解最小二乘法的基础。

三、最小二乘法

好了,现在让我们进入正题——最小二乘法。其实最小二乘法我们在中学统计课程中就接触过,当时用它来做线性回归。现在从线性代数的视角,让我们重新理解它的本质。

3.1 最小二乘解题

【例】 继续探讨上节课的例子,求解过三个点 拟合的直线方程。

  1. 列出方程:假设最优直线方程为 ,将三个点代入可得方程组:

将其转化为矩阵方程 的形式为:

很明显,这三个点不共线,该方程无解。这就是我们面临的问题:方程无解,但我们依然想要找到一个”最优”的近似解。

  1. 计算误差并拟合:由于三点不共线,先计算直线与各点之间的误差(偏移量),用 表示。为便于计算,我们研究它们的平方和

从几何意义上讲,这个过程本质就是将向量 投影到 的列空间中,也就是在列空间中找到距离 最近的点,这个最近点对应就是最优拟合直线。

使用上节课介绍的方程 来拟合直线。在这个例子中,,代入方程求解:

则方程 变为 ,求解可得:

所以得到的直线方程为

  1. 检验:分别将 三个点的横坐标代入拟合直线方程,可以得到拟合直线上各点对应的位置,即 的位置。需要注意的是,最小二乘法的有效性依赖于数据中没有误差过大的异常点。

3.2 性质讨论

上述问题也可以通过使误差最小来计算。将误差化为 ,从微积分的角度,对 求偏导并令偏导为零求极值,也能求得相同的拟合直线。这说明投影方法和微积分方法得到的结果是一致的。

Linear_Algebra161

将误差向量记为 ,对应的投影向量记为 (对应拟合直线上的 值),有 为给定的点的实际 值)。在本题中:

由此可得到以下重要性质:

  1. 误差向量 与投影向量 垂直:即
  2. 误差向量 不仅垂直于 ,还垂直于列空间中的每一个向量。这些性质进一步验证了前文关于投影的相关介绍,符合正交补空间的结论。

3.3 结论证明

在解方程过程中,我们用到了“如果矩阵 各列线性无关,则矩阵 可逆”这一重要结论,之前未给出证明,下面进行证明:

  1. 我们写出零空间方程形式 ,目的是寻找零空间内的所有向量
  2. 证明过程中我们需要用到之前学过的几个结论:

    • 如果矩阵可逆,那么其对应的零空间仅包含零向量;
    • 对于列向量 表示求 的长度平方;
    • ,则必有
  3. 具体证明过程

    • 将方程 两边同时左乘 ,得到
    • 根据矩阵乘法的转置性质 ,则
    • 因为向量的内积 ,而向量的内积为零时,该向量必然是零向量,所以可推得
    • 又因为已知矩阵 各列线性无关,根据线性无关的定义,若 ,则 必为零向量;
    • 综上,我们证得 的零空间只有零向量,根据矩阵可逆的判定条件,若矩阵的零空间只有零向量,则该矩阵可逆,所以 可逆。

这样就完整证明了:如果矩阵 各列线性无关,则矩阵 可逆。这个结论非常重要,它是最小二乘法能够有效求解的理论保证。

四、标准正交基

这部分内容主要是为下节课做铺垫,内容不多,我们简单了解即可。

之前我们接触过的向量组 ,它们两两正交,并且每个向量都是单位向量,长度为 。基于此,我们引入“标准正交向量组”的概念,其中”标准”表示向量是单位向量。

同样属于标准正交向量组的还有 ,这两个向量不仅正交,长度都为 ,也是一个典型的标准正交向量组。

五、学习感悟

本节内容相互关联性强,最小二乘法与投影矩阵之间联系紧密,可以从多种角度进行理解。在学习过程中,记住将向量投影到列空间与左零空间的示意图非常重要,它有助于更牢固地掌握这部分知识。最小二乘法作为线性代数在实际数据拟合中的重要应用,其几何意义非常优美——无解问题转化为投影问题,这种思路值得反复品味。