Linear Algebra-方程组的几何解释-01

概要

从本节开始,我们重新开始学习线性代数的有关知识。首先从解方程谈起,学习线性代数的应用之一就是求解复杂的方程问题,本文的核心就是从行图像和列图像的角度解方程。

方程组的几何解释

二维的行图像

首先我们可以通过一个例子来从行图像角度求解方程:

[例]求解方程:$2x-y=0, -x+2y=3$

我们首先按行将方程写成矩阵形式:$\begin{bmatrix}
2 & -1 \\
-1 & 2
\end{bmatrix}\begin{bmatrix}
x \\
y
\end{bmatrix}=\begin{bmatrix}
0 \\
3
\end{bmatrix}\\
$

系数矩阵(A):将方程系数按行提取出来,构成一个矩阵;

未知向量(x):将方程未知数提取出来,按列构成一个向量;

向量(b):将等号右侧结果按列提取,构成一个向量;

下面我们可以通过行图像来求解这个方程,所谓行图像,就是在系数矩阵上,一次取一行构成方程,在坐标系上作图。和我们在初等数学中学习的作图求解方程的过程无异。由图可知,图中的绿点(1,2)就是方程组的解。

矩阵解的几何形式

二维的列图像

从列图像角度,我们再次求解这个方程 $2x-y=0, -x+2y=3$

这一次我们求解过程中,我们将方程按列提取,使用的矩阵为:$x\begin{bmatrix}
2 \\
-1
\end{bmatrix}+y\begin{bmatrix}
-1 \\
2
\end{bmatrix}=\begin{bmatrix}
0 \\
3
\end{bmatrix}$

如上,我们使用列向量构成系数矩阵,将问题转化为

如何将向量 $\begin{bmatrix}
2 \\
-1
\end{bmatrix}$与向量$\begin{bmatrix}
-1 \\
2
\end{bmatrix}$正确组合,得到结果向量$\begin{bmatrix}
0 \\
3
\end{bmatrix}$?

接下来我们使用列图像求解此方程:

linear_column_pic0

即寻找合适的 x,y 使得 x 倍的(2, -1) + y 倍的(-1, 2)得到最终的向量(0, 3)。很明显能看出来,x 为 1,y 为 2 时满足条件。反映在图像上,显然结果正确。

进一步思考的话,对于 $x\begin{bmatrix}
2 \\
-1
\end{bmatrix}+y\begin{bmatrix}
-1 \\
2
\end{bmatrix}$ 这个方程,如果 x 和 y 可以取任意值,那么可以得到什么呢?显然我们可以得到二维平面中任何方向的向量。

方程组的几何解释推广

高维行图像

我们将方程维数推广,从三维开始,$2x-y=0, -x+2y-z=-1, -3y+4z=4$,如果我们继续使用行图像的方法求解,那么会得到一个很复杂的图像。

矩阵形式如下:

$A=\begin{bmatrix}
2&-1&0\\
-1&2&-1\\
0&-3&4
\end{bmatrix}$,$b=\begin{bmatrix}
0\\
-1\\
4
\end{bmatrix}$,方程:$Ax=b$,$\begin{bmatrix}
2&-1&0\\
-1&2&-1\\
0&-3&4
\end{bmatrix}\begin{bmatrix}
x\\
y\\
z
\end{bmatrix}=\begin{bmatrix}
0\\
-1\\
4
\end{bmatrix}$

如果绘制行图像,这是 3 个平面相交得到一点,常见的思路是先联立其中两个平面,使其相交于一条直线,再研究这条直线与剩下的第三个平面相交于哪个点,最后得到的点坐标即为方程的解。直观上这种求解方式很难直接绘制更高维数的图像。

高维列图像

还是刚刚的例子,$2x-y=0\\-x+2y-z=-1\\-3y+4z=4$,如果我们使用列图像的思路进行计算,那么矩阵形式就变为:

左侧是线性组合,右侧是线性组合组成的结果,这样一来思路就清晰多了,“寻找线性组合”成为了解题的关键。

显然这道题是一个特例,明显$x=0,y=0,z=1$是方程的解,这在行图像中并不明显。

我们之所以更推荐使用列图像求解方程,是因为这是一种更系统的求解方法,即寻找线性组合,而不用绘制每个行方程的图像后寻找那个很难直观看出来的交点坐标。另一个优势在于,如果我们改变最后的结果 b,如本题中,我们将其改为 $x\begin{bmatrix}
2\\
-1\\
0
\end{bmatrix}+y\begin{bmatrix}
-1\\
2\\
-3
\end{bmatrix}+z\begin{bmatrix}
0\\
-1\\
4
\end{bmatrix}=\begin{bmatrix}
1\\
1\\
-3
\end{bmatrix}$,那么我们就重新寻找一个线性组合就够了。但如果我们使用的是行图像呢?那意味着我们要完全重画三个平面图像,就简便性来讲,两种方法高下立判。

另外,还要注意的一点是,对任意的 b 是不是都能求解$Ax=b$这个矩阵方程呢?也就是对于 $3\times3$的系数矩阵A,其列的线性组合是否都能覆盖整个三维空间呢?对于我们上面举的这些例子,都是可以的。但是有些矩阵就是不行的,比如三个列向量本身就只构成了一个平面,那么这样的三个向量组成的向量只能分布在该平面上,肯定无法覆盖整个三维空间。如三个列向量分别为:$\begin{bmatrix}
2\\
-1\\
0
\end{bmatrix}$,$\begin{bmatrix}
-1\\
2\\
-3
\end{bmatrix}$,$\begin{bmatrix}
1\\
1\\
-3
\end{bmatrix}$。这三个向量就构成了一个平面,其中$\begin{bmatrix}
2\\
-1\\
0
\end{bmatrix}+\begin{bmatrix}
-1\\
2\\
-3
\end{bmatrix}=\begin{bmatrix}
1\\
1\\
-3
\end{bmatrix}$。对于这个方程组而言,就无法实现对于任意的 b,方程的解都存在。

矩阵乘法

如 Ax,如果我们已知一个矩阵 A 和一个向量 x,那么我们如何求解它们的积呢?例如 $A=\begin{bmatrix}
2&5\\
1&3
\end{bmatrix}$,$x=\begin{bmatrix}
1\\
2
\end{bmatrix}$,我们这样求:

  • 法一:将矩阵 A 看做列向量的组合:

即 x 每个分量与矩阵中各列向量相乘,再将其求和。

  • 法二:向量点乘

感悟

该部分内容是对线性代数内容的初涉,从解方程谈起,引入列空间的概念,可以发现从列空间角度将求解方程,变化为求列向量的线性组合,这种方法更加科学,并从列向量的线性组合方式了解矩阵乘法。