Linear Algebra-马尔可夫矩阵和傅里叶级数-24

一、知识概要

本节介绍了马尔科夫矩阵与傅里叶级数,是对特征值以及之前大量知识的一次总结。学习重点在于理解相关概念的应用,内容侧重于整体框架的把握,并非十分深入细致。

二、马尔科夫矩阵的性质及其应用

2.1 马尔科夫矩阵的性质

先给出一个马尔科夫矩阵示例:

马尔科夫矩阵需满足两条性质:

(1) 每个元素均为非负数。

(2) 每列的元素和为 1。

马尔科夫矩阵具有一个重要性质:如果 A 是马尔可夫矩阵,则 A 的幂也是马尔科夫矩阵。

接下来讨论矩阵次幂运算的“稳态”概念。在上一节学习的微分方程稳态问题中,我们通过特征值和 0 的关系来判断稳态,而在矩阵幂次运算中,稳态的判断方式有所不同,这就涉及到特征值与特征向量。研究马尔科夫矩阵的特征值,会发现它具有以下性质:

(1) 是一个特征值。

(2) 其余特征值满足

证明性质(1)很简单,以给定矩阵为例,将代入可得:

该矩阵每一列元素之和为 0,是不可逆矩阵,三行相加得到零行,行/列向量线性相关,所以 1 是其特征值,存在对应特征向量。也可以说每列元素和为 1 的性质决定了其有特征值 1。性质(2)在课上未证明,但同样成立。

回到判断次幂运算的收敛性问题。回忆之前差分方程中的算式,这也属于矩阵次幂运算。

根据马尔科夫矩阵的特点,,其余,所以次幂运算最终会收敛于中的部分,这就是其稳态性质:在马尔科夫矩阵中,若其特征值 1 所对应的特征向量的元素全为正,且初始值是正的,那么稳态也是正值。

这里补充一个关于转置矩阵特征值的知识点:

由之前介绍的行列式性质十可知,转置矩阵与原矩阵行列式值相同,应用到这个方程上,可得:

也就是说,当时,也为 0,它们的特征值是一样的。但需要注意的是,虽然的特征值等于的特征值,然而它们的特征向量并不相同,因为它们不属于的同一个空间。

2.2 马尔科夫矩阵的应用

下面研究方程(其中,A 是马尔科夫矩阵)。

以研究加州和麻省的人口问题为例,假设 A 是一个 2×2 的矩阵,用来表示一年后人口的迁移情况。矩阵的四个元素分别表示留下和迁出的概率,且在这个过程中总人口数保持不变,同时要求马尔科夫矩阵不变(即每次变动的概率一样)。给定等式如下:

(中间的矩阵表示有 0.9 的比例的人口留在加州,0.1 从加州迁移到麻省,0.8 的人留在麻省,0.2 的人迁移到加州,这是一个马尔科夫矩阵)

下面分析其稳态:

假定初始状态为:

经过一次变迁之后,两州的人口状况是:

计算该马尔科夫矩阵特征值为 1 和 0.7,对应求得特征向量为

现在来看经过无穷次迁移之后,人口状况的稳态情况。根据公式:

只有会反映最后稳态时的人口分布状况。代入初始情况计算的值:

最后得到的稳态结果就是,总数不变,分布由中的反映出来。

三、傅里叶级数

3.1 前提基础

假定有一组(n 个)标准正交向量,它们是 n 维空间的一组完整基。那么此空间中,任意向量可由这组基的线性组合表示:

矩阵化的表示方法是:

于是有:

由于 Q 是正交阵,之前介绍过,所以可以得到:

对应到各个分量:

这个结论也可以通过来计算。因为中的都是标准正交基,满足,在两侧同时乘上,同样能得到,其意义是通过向量与标准正交基的点乘,求得各分量。

3.2 傅里叶级数

设函数

这个问题与之前向量在标准正交基下的表示有相似之处,都是无穷维的情况,关键性质是函数正交。上述形式就是傅里叶级数,它作用在函数空间上,用函数来代替向量,使用正交函数来代替标准正交基 ,在这个函数中,基就是 。傅里叶级数成立的原因是这些基是正交的。

(1) 函数空间下的“正交”解释:

我们知道,对于向量的点积为:

向量可以看作是离散的,而上面给出的函数在其定义域上是连续的。对于两个连续函数而言,对比向量内积形式,与之最相似的情况是在每个值上的 ,在连续情况下对应的就是对其进行积分。由于函数是一个周期函数,周期为 ,所以这里积分上下限最好取从0到

定义好函数空间的内积之后,可以检验傅里叶级数中的基是正交的。

(2) 系数的求解问题:

以求解其中的为例,与之前讲过的向量求解类似,利用正交基,将函数作内积,可得:

投影到这个基上,经过计算剩下,和向量形式一样,所以的值为:

其他系数的对应值以此类推。可见,函数也可以展开到一组标准正交基上

三、学习感悟

这部分内容的学习重点在于理解。对于马尔科夫矩阵,关键是理解人口迁移模型的应用;而傅里叶级数实际上是将之前向量向标准正交基投影的形式,拓展到了函数向正交函数投影的展开形式。只要理解了正交函数的概念,相关问题就比较容易理解了。