L24-马尔可夫矩阵与傅立叶级数
参考
这一节课继续介绍特征值和特征向量的应用,马尔可夫矩阵是一种特殊的矩阵,它同样可用于描述随时间变化的系统,同样是通过它的特征值和特征向量来研究该系统的趋势。
另外介绍了傅立叶级数,与向量的投影(以正交向量展开)相关,类比向量的行为,可以将任意函数展开为周期性的三角函数。
满足以下两条性质的矩阵称为马尔科夫矩阵 Markov Matrix
- 每个元素都是非负数(大于或等于 )
- 每列元素之和为
提示
马尔可夫矩阵与概率相关,由于概率都是非负数,且必然事件的概率为 ,这是马尔科夫矩阵所满足的两条性质的缘由
例如以下矩阵 为马尔可夫矩阵
马尔可夫矩阵具有以下一些特性
- 马尔可夫矩阵 的平方 (或更高次幂 ),其结果矩阵依然是马尔科夫矩阵
- 是马尔科夫矩阵的其中一个特征值
证明
假设马尔可夫矩阵 具有特征值 ,根据特征值的定义可知 等式成立,即方程 必有解
只要当 为奇异矩阵时,方程 必有解
所以要证明矩阵 具有特征值 ,就只需要证明 为奇异矩阵
由于马尔可夫矩阵 每列元素之和为 ,则从行向量的角度来考虑,它们的一种线性组合满足为
那么对于矩阵 各行向量的对应的线性组合为
所以矩阵 的行向量是线性相关的,即该矩阵为奇异矩阵,由此可证马尔可夫矩阵 具有特征值
- 除此之外,其他特征是都比 小
马尔可夫矩阵的特征值满足一些特性,所以由马尔科夫链构成的等差方程 其稳态也有特定的规律
由前面的课程可知等差方程 的通解形式为
马尔可夫矩阵具有特征值 而其他特征值满足
所以当 时,
提示
如果初始值 是正值,那么特征值 所对应的特征向量 各元素就会是非负数,所以 的极限值/稳态也会是非负数
转置矩阵 与原矩阵 具有相同的特征值
证明
已知矩阵 的特征值 满足 (特征方程)
而根据行列式的特性十(转置矩阵的行列式和原来矩阵的行列式一样)可知矩阵 的行列式和矩阵 的行列式相等
将以上等式的的左边进行简化可得
所以 该等式形式就是针对矩阵 而言的特征方程
即矩阵 的特征值 也可以使得针对矩阵 而言的特征方程成立,所以 也是矩阵 的特征值
马萨诸塞州(麻省)的人口为 ,加利福尼亚州(加州)的人口为 ,以它们构成一个向量
假设各州的原始人口为
每年都会有 的人口留在加州,则有 的人口迁去麻省;而每年会有 的人口留着麻省,则有 的人口迁去加州
那么到第 年后,各州人口 是多少?
根据各州的人口迁移概率,可以列出人口随时间变化的递推公式(差分方程)
其中系数矩阵 为马尔科夫矩阵
所以它具有一个特征值为
再根据特征值之和为矩阵的迹 可得
将特征值分别代入到方程 求出相应的特征向量
- 当 时
可得其中一个特征向量为 - 当 时
可得其中一个特征向量为
根据前面的课程可知等差方程 的通解形式为
所以 为
将以上矩阵形式写成方程组形式
解得 和
那么 为
由于后一项趋于 ,所以
在之前关于投影的的一系列章节中介绍过正交基(标准正交向量 orthonormal basis),这些向量相互垂直 ,模长都是
在 向量空间中,任何一个向量 都可以展开 expansion 为一系列标准正交向量
可以借助不同标准正交向量的内积为零 (以及模长为 )的特点,求出线性组合中各个系数的值
例如需要求解第一项的系数 ,则可以在以上等式的两边同时乘上向量
可得 通过类似的方法,可以求出其他项的系数
提示
可以写成矩阵形式
其中矩阵 是正交矩阵,它由一系列的标准正交向量 作为列向量构成 ,而列向量 是由线性组合的系数构成
由等式 可解得列向量 为
由于正交矩阵的逆矩阵就是其转置矩阵
所以 这个解的形式,和前面所得的向量中各元素 是一致的
类似地,可以用一系列三角函数 trigonometric functions(正交函数,它们直接相互「垂直」,基函数的内积为零)来展开一个函数 称为傅立叶级数
提示
任意向量 可以展开为一系列的标准正交向量 的线性组合(求和)
傅立叶级数与之类似,相当于用正交函数代替了正交向量,其中各项的基依次为
不同的是,向量使用正交基展开得到的是有限数量的项,而傅立叶级数展开得到的是无限数量的项
向量内积与函数内积
向量的内积 inner product 的定义为(两个向量的各元素依次相乘再求和)
由于向量是离散型的数据(由各个元素构成),而对于连续型的函数,其内积定义需要进行调整(从求和变成积分)
函数内积 inner product 的定义
例如当 它们两者的内积为(由于它们是周期函数,所以积分范围从 到 )
所以 和 的内积为 ,它们是正交函数(相当于「垂直」),可以作为傅立叶级数的展开式的基
可以类比求解向量的正交基展开式各项的系数的方法,求出傅立叶级数各项的系数
说明
第一项 是常数项,它的值是各个展开式的平均值 ❓
所以求解系数应该从第二项 开始
例如需要求解第一个傅立叶系数 ,则可以在展开式的两边同时乘上 (计算一系列的函数内积)
由于除了第一个系数项以外, 与展开式其他项的各个函数之间的内积为零(它们之间互为正交函数),所以最后右侧可以化简为只有 这一项
可得