L26-对称矩阵及正定性
参考
对称矩阵 Symmetric Matrices 是指满足 的特殊矩阵
特殊矩阵在特征值和特征向量上有所反映,例如 Markov Matrices 马尔可夫矩阵
(各元素都是实数的)对称矩阵会满足以下两条特性:
例如单位矩阵 是对称矩阵,它的特征值都是 ,它的列向量就是特征向量,满足以上一个特性
证明
根据特征值 的定义,可知它们满足等式
先假设对称矩阵 特征值 和特征向量 都可能含有复数
根据等式 (两边同时取共轭复数)可得
如果矩阵 各元素仅由实数构成,则 ,则以上等式为
然后对以上等式两边分别进行转置,可得 (其中 是常数,所以不参与转置操作)
在以上等式 两边同时乘上 可得
由于矩阵 是对称矩阵,所以 ,则以上等式可以化简为
在等式 两边同时乘上 可得
上述两个等式的左边都相同,所以它们的右边也是相等,可得
由于 表示复数 的模长的平方
💡 在涉及到复数的计算时,常常通过共轭复数和原复数相乘,将其变换为实数
所以当 不为零向量时,即 ,可得 则表示所有的特征值 为实数
如果矩阵 各元素可能由复数构成,如果要证得相同结论(特征值都是实数),则对应的前提条件是 (可以将这个等式关系称为「完全对称」,这是针对更一般矩阵,其中元素可能有复数的场景)
以上是对于对称矩阵的第一个特性(特征值都是实数)的证明,而第二个特性在课堂上并没有给出证明,具体可以查看教材的相关部分
在前面的课程中介绍过,对于有 个线性独立的特征向量的矩阵 ,可以(对角化)分解为
由于对称矩阵的特征向量是相互垂直的,所以特征向量矩阵 是正交矩阵,可以记作
则对称矩阵 可以(对角化)分解为
由于正交矩阵 满足 ,则以上等式可以变形为
提示
由于矩阵的置换操作(只需要将行和列的相应元素对调即可得出置换矩阵),比求解逆矩阵简单,所以置换矩阵 比 更容易求得,所以通过以上变形所得的等式更常用
对称矩阵可分解为 称为 Spectral Theorem 谱定理
提示
这里的「谱」是指对称矩阵的特征值的集合,因为它们相互正交,就像光谱分解为不同的颜色一样(它们构成白光 ❓)
相应地,如果一个矩阵可以(对角化)分解为 (其中 为正交矩阵),则该矩阵为对称矩阵
证明
如果矩阵 可以分解为 其中 是正交矩阵
则逆矩阵为
由于 是对角矩阵,所以它的置换矩阵 等于其自身
所以以上等式可以进一步变换
所以矩阵 是对称矩阵
可以将谱定理 进一步展开(另一种理解角度)
以上等式展开到最后是两个矩阵相乘(其中 表示列向量,则 表示行向量),以列向量与行向量相乘的角度来考虑,会得到一系列维度相同的矩阵,再相加
则以上等式可以进一步展开为
其实以上的每一个项 都是投影矩阵,所以对称矩阵(从另一个角度来看)可以分解为一系列的投影矩阵的(相加)组合,而组合中各项的系数是相应的 特征值
投影矩阵
投影矩阵应该满足以下两个特性
对于
- 满足特性一
- 如果正交向量 是经过了标准化的,则 就是单位矩阵,所以前面等式可以化简为 满足特性二
所以 的结果矩阵是投影矩阵,将任意向量投影到 的列空间(其实就是向量 所在的直线)
而且 也是对称矩阵
对称矩阵 的一系列主元的(正负)符号(数量)与一系列特征值的(正负)符号(数量)一样
一般通过求解特征方程 来得到所有的特征值,但是对于维度较大的矩阵 求解比较困难(运算量大),而通过消元变换得到简化行阶梯形式相对比较简单,从中可以知道矩阵的各个主元,再利用前面所述的主元与特征值正负号数量相同的特性,可以从中了解到特征值的部分信息
例如将原矩阵(对称矩阵)拆分/简化为 形式
- 首先通过 的主元的正负性,可以知道矩阵 的特征值正负性
- 由于矩阵 与原矩阵 的特征值存在特定的数量关系,矩阵 的每个特征值 都比原矩阵的相应特征值少
- 所以根据矩阵 的特征值正负性(与 相比),推导出原矩阵 的特征值与 的大小关系(与 相比)
正定矩阵 Positive definite 是指特征值都为正数的对称矩阵
提示
根据前面介绍的定理,可知正定矩阵的主元也是正数
同样可以根据矩阵的主元的正负性来判断一个矩阵是否为正定矩阵
例如以下是一个正定矩阵
观察矩阵 可知其中一个主元是 ,设另一个主元是
矩阵 的特征值是 ,由于对角矩阵的特征值是其对角线上各元素(即主元)的乘积,所以矩阵 的行列式与主元的关系式是 解得
提示
也可以通过消元变换得到简化行阶梯形式,求出矩阵的主元
所以矩阵 的两个主元都是正数,即矩阵 是正定矩阵
注意
根据矩阵的特征值的积等于行列式 所以正定矩阵的特征值也是正数
但是反过来则不一定成立,即矩阵的行列式为正数并不能推断它就是正定矩阵
例如矩阵 的行列式是 是正数,但是它的特征值都是负数,所以它不是正定矩阵
如果要根据特征值的正负判断方阵 是否为正定矩阵,则除了要验证矩阵自身的行列式是否为正,还需要验证(沿着对角线向上的)(其中 )个「子方阵」的行列式是否都为正
例如对于矩阵 除了要验证矩阵本身的行列式,还要沿着对角线「向上回溯」查看各个子矩阵的行列式
在这个示例中则需要考察矩阵 的行列式,它的行列式是 不是正数,所以原矩阵并不是正定矩阵