L21-特征值和特征向量
参考
特征值 Eigenvalue 和特征向量 Eigenvector,与行列式一样,反映了矩阵的信息
说明
行列式、特征值、特征向量都是针对方阵而言的,即讨论一个矩阵的行列式、特征值、特征向量时,假定了该矩阵就是 方阵
函数 的作用是对于传入自变量 ,函数 对其进行转换,得到因变量 。如果以函数的角度看待/思考矩阵 ,对于传入一个向量 进行转换作用,得到结果向量
结果向量 一般与原向量 的方向不同,对于那些转换后依然与原向量平行(方向可以相同也可以相反)的向量 称为特征向量
对于矩阵 ,其特征向量是指那些使得 成立的向量 ,也可以表示为 则系数 为特征值(所以特征向量和特征值伴随出现)
当特征值为 时,矩阵 的零空间中的向量就是特征向量(或者说特征向量构成了零空间)
说明
如果特征值为 ,那么等式就变成 ,其中使得该等式成立的向量 就是特征向量
而对于方程 的解,构成了矩阵 的零空间
所以当特征值 时,矩阵 的零空间中的向量就是特征向量(或者说特征向量构成了零空间)
对于奇异的 singular 矩阵 ,由于矩阵中存在非线性独立的列向量,所以 必有解,即当矩阵 是奇异矩阵时, 必然是该矩阵的特征值之一
以下介绍一些特别的矩阵,利用它们的特性来求解(通过分析直接得出)特征值和特征向量
对于矩阵 (由它的两个列向量可以构成一个平面),其投影矩阵是
投影矩阵的作用
投影矩阵(以相乘的方式)作用于向量 所得的结果向量 是向量 在平面的分量
所以投影矩阵的作用相当于将向量 投影于平面上
根据投影矩阵 的特殊作用/定义,可以知道:
- 当向量 位于平面上时,满足 即向量在平面上的投影等于自身。
而根据特征向量的定义,可知这样的向量(位于平面 上)就是投影矩阵的特征向量,此时特征值为 - 当向量 垂直于平面时,满足 即向量在平面上没有分量。
而根据特征向量的定义,可知这样的向量(垂直于平面 )就是投影矩阵的特征向量,此时特征值为
提示
投影矩阵 的这两类特征向量正好相互垂直,所以由它们就可以张成整个(矩阵维度所在的)向量空间
但是这只是特例,并非所有矩阵的特征向量都可以张成其所在维度的向量空间
对于以下对称矩阵
其作用是将(与之相乘的)向量 的元素(上下)互换
求该矩阵的特征向量和特征值,就是要寻找使得等式成立 的向量和系数
可得
将等式写成方程组形式
将第二个等式 代入第一个等式中 以替换掉 可得
解得 或
- 当特征值 ,代入到以上方程组,可得 ,那么其中一个特解是 ,所以其中一个特征向量是
- 当特征值 ,代入到以上方程组,可得 ,那么其中一个特解是 ,所以其中一个特征向量是
💡 正好该矩阵的两类特征向量也可以张成矩阵所在的向量空间,由于矩阵是对称矩阵 ,所以两类特征向量相互垂直
对于 矩阵,具有 个特征值(可能会存在相同的值)
特征值之和称为迹 trace,也正好等于矩阵对角线上元素之和,即
根据特征向量的定义而得的等式 其中属于未知数的有系数 (特征值)和变量 (特征向量),在求解时需要分步骤:
- 首先求出 特征值
将等式 变换为 为了让该等式必然成立(方程组必然有解),则需要矩阵 是奇异矩阵
注意
对于等式/方程组 必然有解 但是零向量是无用特征值,因为任何矩阵与零向量相乘,其结果向量都必然是零向量
所以上面所说的「让该等式必然成立(方程组必然有解)」并没有去考虑 的必然情况
分析并没有从 入手,而是从使得 必然有解(非零解 ❓)入手,得出矩阵 需要是奇异矩阵
提示
对于 其中 的作用就像是对矩阵 进行「校正」/「平移」 shifted,使得它变成一个奇异矩阵
而奇异矩阵的行列式为 ,所以可以得到关于 的方程
说明
被称为 key equation 关键方程/ characteristic equation 特征方程/ eigenvalue equation 特征值方程
求解 可以得到矩阵的所有特征值(对于 的矩阵,有 个特征值,即以上方程会有 个解,虽然可能出现解的值相同的情况,但实际上数量依然是 个)
- 接着求解 特征向量
将上一步骤中所求出的 个 值分别代入到等式中 则得到 个关于 的方程
求解每个方程 则可以按照求解矩阵 零空间的步骤进行(消元法找出矩阵的主元 ➡️ 为其中的自由变量赋值 ➡️ 求出特解/特征向量)
使用以上算法步骤求解特殊的矩阵的特征值和特征向量
求解以下对称矩阵的特征值和特征向量
根据算法步骤进行求解:
- 求出特征值
求解关于 的方程
解得 或
提示
一元二次方程可以进行因式分解得到
如果将以上式子展开可得 ,所以两个解的和 为一次项系数的相反数,两个解的积 为常数项
所以对于以上例子中矩阵 的两个特征值 和 ,它们的和为 ,它们的积为
此外对于矩阵而言,它的对角线上的元素的和 这特征值的和一样,前面以及提到,该值也称为矩阵的迹 track
另外矩阵 的行列式是 ,正好是特征值的积,其实该规律具有一般性,即 特征值的积等于矩阵的行列式
- 分别将以上求出的特征值 代入到等式 中
- 当 时
其中一个特解为 - 当 时
其中一个特解为
提示
对比前面的例子 它的特征值为 时,特征向量是 ;特征值为 时,特征向量是
而该例子 它的特征值为 时,特征向量是 ;它的特征值为 时,特征向量是
两个矩阵的关系 ,而两者特征值的对应关系是 ,而两者特征向量并没有发生变化
这是由于矩阵的特征值和特征向量满足等式 ,当矩阵发生变化从 变成 时,等式会发生相应的变化
特征值变成了 但特征向量不变
但以上规律只适用于矩阵通过 (单位向量的倍数)进行「平移」 shifted,而一般不适用于与其他类型的矩阵作用下的变化
例如已知矩阵 和 的特征值和特征向量,满足等式 和 ,但是一般无法得到 这样的等式,因为一般两个矩阵的特征向量是不同的,所以不能进行合并同类项
旋转矩阵是一种特殊的正交矩阵,记作 ,该矩阵可以将(与之相乘的)向量旋转
以下是一个旋转矩阵
求它的特征值
提示
假如该矩阵的特征向量是 ,而结合该矩阵的作用,向量 经过该矩阵的作用后,所得的结果向量 都会与原矩阵垂直,那么这个和特征向量的(平行)定义矛盾
而根据之前的分析,该 矩阵具有 个特征值 和 ,而特征值的和 和矩阵对角线上元素之和一样,即 ,特征值的积 和矩阵的行列式一样,即
根据 和 这两个矛盾的等式,可知该矩阵没有实数的特征值
通过求解特征方程 求出特征值
可得 或 (一对共轭复数)
其实特征值与矩阵的对称性相关:
- 若矩阵是对称矩阵 symmetric,即矩阵满足 ,那么它的特征值都是实数(而且特征向量相互垂直 ❓)
- 若矩阵是反对称矩阵 anti-symmetric,即矩阵满足 ,那么它的特征值是虚数(即复数中没有实数的部分)
- 若矩阵的对称性介于完全对称和反对称之间,那么它的特征值是复数(每个特征值都是由实数和虚数构成 ❓)
求以下对角矩阵的特征值和特征向量
- 通过求解特征方程 求出特征值
解得 正好是矩阵对角线上的元素 - 将以上求出的特征值 代入到等式 中
当特征值为 时
其中一个特解为
以上 矩阵只能得到 类特征向量(无法得到 类线性无关的特征向量),这是由于有重复的特征值造成的,这种类型的矩阵称为退化矩阵 degenerate matrix
三角矩阵 triangular matrix 的特征值( 个)和矩阵对角线上的元素一样