对于 矩阵 如果具有 个线性独立的特征向量,则可以通过以下公式将矩阵「变成」对角矩阵,该过程称为矩阵的对角化 diagonalization
以上公式中矩阵 是由 个线性独立的特征向量作为列向量所构成的,矩阵 是 个特征值作为对角线上的元素的方阵(其他元素为 )
注意
矩阵的对角化需要满足一个前提:矩阵 具有 个线性独立的特征向量
这样由 个线性独立的特征向量作为列向量所构成的矩阵 才是可逆矩阵,才存在矩阵 ,以上公式才成立
证明
如果矩阵 具有 个线性独立的特征向量,它们分别为(列向量),将它们构成矩阵 ,称作特征向量矩阵 eigenvector matrix
那么对于两个矩阵相乘 可以得到
根据特征向量的定义,特征向量满足等式
所以以上等式(以矩阵与列向量相乘的角度考虑)可以进行以下转换
再将以上的结果矩阵进行分解,(通过对角矩阵)提取出各向量前面的系数
将由一系列的特征值 所构成的对角矩阵记作 (采用符号 因为它是 的大写形式),称作特征值矩阵 eigenvalue matrix
然后在以上等式 两边同时乘上逆矩阵 ,即可证得
以上公式也可以写成矩阵分解的形式
其他类型的分解
在前面的章节里,也有对矩阵 进行不同类型的分解:
- 使用消元算法,将矩阵 分解为 ,其中 和 都是对角矩阵
- 使用正交算法,将矩阵 分解为 其中 是正交矩阵(由一系列的标准正交(列)向量 所构成的矩阵), 是上三角矩阵
当矩阵 的特征值 互不相同时(即没有重复的特征值),则矩阵 必有 个相互线性独立的特征向量(该矩阵 可以对角化 diagonalizable)
提示
对于以上定理课堂上并没有证明,可以查阅书籍上的相关章节
大部分矩阵都满足有 个相互线性独立的特征向量,所以在以下章节里都是假定了矩阵满足这个前提条件
而对于矩阵存在重复特征值时,则矩阵 不一定存在 个线性独立的特征向量,需要计算出具体的特征向量才可以判断
- 例如对于单位矩阵 (它也是一个对角矩阵,其特征值就是对角线上的元素;也可以通过求解特征方程 可以得到矩阵的所有特征值),具有的特征值 个相同的特征值
将特征值 代入到方程 求出特征向量
由于(不可逆矩阵) 的零矩阵的自由变量有 个,所以可以得到 个特解(列向量),而且它们是线性独立的
即对于单位矩阵 有 个线性独立的特征向量,所以单位矩阵 可以进行对角化 - 而对于以下 对角矩阵,具有两个相同的特征值
(也可以通过求解特征方程 可以得到矩阵的所有特征值)
将特征值 代入到方程 求出特征向量
其中一个特解是
由于(不可逆矩阵) 的自由变量只有 个,所以只需要 个特解就可以张成方程组的通解,所以对于特征值 的特征向量是
对于 也是得到同样的特解
即对于以上例子没有足够的(需要 个)线性独立的特征向量,所以矩阵 无法进行对角化
已知特征向量满足 求矩阵 的特征值和特征向量
说明前提
这里假定了矩阵 具有 个相互线性独立的特征向量
根据矩阵 特征向量所满足的等式,可以得到
由于 是矩阵 的特征值(常量),可以提到等式的最前面,以上等式可进一步变换
观察以上等式的形式 ,将 看作一个整体(矩阵),满足特征向量的等式,则其中 就是矩阵 的特征值,特征向量是
由于等式 是由等式 导出的,所以其中的特征向量 满足这两个等式,即矩阵 和 的特征向量相同
已知 可得 ,即矩阵 的特征值是 , 特征向量是 ;而矩阵 的特征值进行相应的变换,变成 ,而特征向量不变,也是
从矩阵分解(对角化)的角度来考虑,也会得到类似的结论:根据矩阵根据对角化公式,可以将矩阵 分解为
那么对于 可以得到
对比 和 ,可知在分解结果中由特征向量构成的矩阵 在两个等式中都不变;而由特征值构成的对角矩阵 ,在矩阵 的分解结果中是 ,而在矩阵 的分解结果中变成了
具体到矩阵 里的每个元素而言,它们实际上也是变成平方
以上的结论/规律其实可以拓展到更高阶,即已知矩阵 分解为 ,则对于矩阵 可以分解为 ,其中 不变, 变成 次方
使用以上等式 可以对理解/计算/分析矩阵的幂有更好的方法
例如当高阶矩阵 随着 增大,趋同于零矩阵,可以知道原矩阵 的特征值 满足的条件
根据矩阵的幂的分解公式 可知 并不随 变化,所以造成 随 变化的是矩阵 ,它也是随着 增大趋同于零矩阵
由于特征值矩阵 是由一系列的特征值 作为对角元素(其他元素为 )所构成的,那么可得 的形式如下
需要让 随着 增大趋同于零矩阵,实际上就是要让矩阵对角线上的每个元素 随着 增大趋同于
即当 时,要让 成立,则 满足的条件是
差分方程
Recurrence relation 递推关系式(也称作 Difference equation 差分方程)是一种递推地定义一个序列的方程式,即序列的每一项目被定义为前若干项的函数
其中一阶差分方程是指递推式中,只包含前后的两项关系,例如 ;而二阶差分方程是指递推式中,包含前后共计三项的关系,例如斐波那契数是由递推关系 所定义的
使用矩阵的幂的分解公式,可以一阶对等比递推公式进行「拆解」简化,以求出通项公式
向量 满足差分方程 ,且已知首项是向量 ,可以用矩阵 的特征值和特征向量表达向量 的通项公式
说明
这里假定了一个前提是矩阵 具有 个相互线性独立的特征向量
由差分方程 可知向量 和矩阵 是可以相乘的,那么向量 的维度(元素数量)和矩阵 的列数是相同的
另外一个未提及的隐藏前提是,在涉及行列式的课程和问题中,都默认所研究的矩阵为方阵
所以可以简单地称作向量 和矩阵 (列和行)的「维度」是相同的
由于矩阵 具有 个相互线性独立的特征向量 ,所以它们可以张成(矩阵 所在的) 向量空间,即通过它们的线性组合可以得到该空间中的任何一个向量
(假如在计算矩阵 的特征向量时,都采用单位向量作为特解)那么 维的向量 (它在 向量空间中)可以「分解」这 个单位向量(特征向量)的线性组合
其中 是向量线性组合时的相应系数
先考察 的分解情况
根据特征向量所满足的等式 ,所以上式可以进一步变换
再进一步考察 的分解情况
由于 ,所以可以将以上 的分解结果代入得到
同样根据特征向量所满足的等式 进一步变换
依次类推……
可得 的分解结果
根据递推公式 以及首项 可知
所以 的通项公式为
提示
还可以利用对角矩阵,将以上长串的等式写成简短的形式
其中各矩阵的构成是
- 特征值矩阵 :以特征值 作为对角线上的元素(其他元素都是 )构成
- 特征向量矩阵 :将特征向量 作为列向量构成
- 系数矩阵 :将系数 作为对角线上的元素(其他元素都是 )构成
斐波那契数列是 所满足的递推公式是 求出通项公式
由于递推公式是 是二阶差分方程,(为了可以使用矩阵的幂的分解公式进行求解)需要转变矩阵形式而且是一阶的差分方程,所以构建以下等式组
以上等式组可以写成矩阵的形式
令 ,则以上等式可以写成
通过以上的变换将二阶差分方程转换为一阶差分方程,然后就可以使用前一小节的结论先求出 通项公式,再求得 的通项公式
- 首先确保(以上变换得到的一阶差分方程中的矩阵) 满足矩阵分解的前提
说明
由于它具有两个不同的特征值 和 ,所以该矩阵具有两个不同的特征向量,可以用它们的线性组合来表示数列的第一项
那么接下来的关键就是求出首项的分解等式中的各个特征向量(以及相应的系数) - 可以通过求解特征方程 得到矩阵的所有特征值
解得 或 - 再将上一步所求出的特征值分别带入方程 求出特解(特征向量)
这里通过直接观察方程的结构特点
可以推导出方程的解的结构为
将上一步所求出的 和 分别代入,可得对应的特解(特征向量)为 和 - 然后再将以上求得的特征向量 和 代入首项的分解等式中 求出相应的系数
将以上等式从矩阵转换为方程组形式
解得
- 根据等比数列的递推式 以及首项 可得 ,并根据上一小节的结论,可得 的分解形式(通项公式)
再根据 与 的关系
所以 的通项公式为
数列的增长速率
在斐波那契数列的通项公式 中有两个 次项,其中前一项 的值大于 (约为 ),而后一项 的绝对值是小于 的(约为 )
所以随着 的增大,后一项项会趋于 ,那么 的增长速率只与前一项相关
结合所构造的矩阵 而言,斐波那契数列数列的增长速率只与该矩阵的特征值 相关
该规律可以拓展至一般的等比数列,根据(通过矩阵的分解形式)所求出数列的通项公式可知,等比数列的增长率由所构造的矩阵的特征值决定