L23-微分方程和exp(At)
参考
两个变量 和 随着时间 变化(即它们都是关于 的函数),它们的变化率如下
已知在初始状态 时 、
提示
由于 的变化率是 , 的变化率是 ,所以两者的变化是相互影响的
并结合初始值,可以推测出 是随着时间 的增加而减小的,由于它的变化率是负值;而 的变化则是相反的。这个变化规律可以通过求出 和 具体的函数表达式来验证。
根据以上条件求解 和 (函数的具体表达式)
说明
以上两个变化率等式都是一阶线性微分方程
- 微分方程是指具有函数关系以及含有一个或以上的导数的方程
- 一阶是指等式中的导数部分(对于这个例子就是指等式的左侧)只包含一阶导数 而没有更高阶的导数
- 线性是指等式中的其他部分(对于这个例子就是指等式的右侧)是线性的 ❓,没有高阶的变量
首先令 将以上微分方程组转换为矩阵的形式(将系数矩阵记作 )
则在 时
提示
经过转换后的等式 是一阶常系数线性方程,这里的常系数是指矩阵 ,而且没有常数项
对于这种形式的微分方程,它的解 为指数形式
转换后的微分方程的通解形式是
其中 和 是系数, 和 是矩阵 的特征值, 和 是矩阵 的特征向量
提示
在课堂上并没有直接推导证明这个通解,而是通过代入特解进行验证
以上的通解 可以看作是由两个向量 和 通过线性组合所构成的(线性组合的系数为 和 ),可以代入其中一个特解进行验证
当 时
对于 可得
而对于 可得
对比两个等式
再根据特征向量的定义可知 即以上左右两部分是相等的
所以 是 的特解,使用同样的方法可以验证另一个特解
所以 是形式如 的微分方程的通解
在微分方程的通解中 特征值是指数形式的
可以与上一节课的结论进行横向对比,在差分方程的通解中 特征值是幂形式的
根据通解的形式,则需要求出矩阵 的特征值和特征向量
观察矩阵 可知它是一个奇异矩阵/不可逆矩阵,则 必然是该矩阵的特征值之一 ,再根据特征值的特性可知矩阵的迹 ,可得
所以矩阵 的特征值是 和
提示
也可以通过求解特征方程 来得到矩阵的所有特征值
解得 或
将以上求得的特征值分别代入方程 求出相应的特征向量
- 当 时
其中一个特解 - 当 时
其中一个特解
将以上所得的矩阵 的特征值和特征向量代入通解 的表达式可得
再根据初始状态求出系数
提示
其实可以将以上等式写成矩阵形式
那么通解在初始状态用矩阵表示就是 ,其中 是特征值构成的矩阵, 是系数构成的列向量
将以上等式转换为方程组形式可得
解得
所以微分方程 的通解为
提示
将微分方程 的通解 进行「拆分」就可以得到原微分方程组 和 的通解
观察微分方程的通解 可知它随时间的变化情况:
- 开始状态为 即 、
- 然后随着时间的增大 的值减小, 的值增大
- 当 时, 趋于稳态 ,即 、
由于在时间增大的全过程中 和 之和都为 ,从开始的 、 变成最终的 、 可以将此变化看作是 的部分值「流向」了 ,并最后趋于稳态 steady
稳定性
对于微分方程 的通解 当 时,其稳定性与系数矩阵 的特征值相关:
- Stability 稳定:如果所有特征值的实数部分都小于零 ,则当 函数 都会趋于零
- Steady State 稳态:如果其中一个特征值的实数部分等于零 ,而其余的特征值的实数部分都小于零 ,则当 函数会趋于一个数 (和 Stability 稳定一样,也是会趋于一个固定值,但这个值和哪个特征值为 相关)
- Blow up 无法收敛:如果所有特征值的实数部分都大于零 ,则当 函数 无法收敛
对于微分方程 如果其系数矩阵 是一个 矩阵,由于它的特征值只有两个,所以可以直接通过矩阵的元素来判断通解 的稳定性
对于 矩阵
根据特征值的特性可知
如果矩阵的迹小于零 并且矩阵的行列式大于零 ,则可以推导出矩阵 的两个特征值 和 都是负数,则当 微分方程的通解会处于Stability 稳定
注意前面在讨论特征值时,都只是考虑特征值的实数部分 (特征值可能是复数,具有虚数部分),由于将虚数映射到直角坐标系后,(在几何形状上)它是绕着一个单位圆变化的 ❓ 所以该部分的值对于函数的收敛性并没有很大的影响,可以忽略不计
使用矩阵 表达微分方程组时,矩阵 的作用相当于将变量 和 进行耦合,这可能会让求解过程变得更复杂
可以利用矩阵的对角化进行解耦,即将以上等式中的列向量 表达为矩阵 的特征向量的某种线性组合,通过换元可以得到变量之间解耦的微分方程,便于求解
如果使用矩阵 的特征向量 为基,则列向量 可以表达为
其中矩阵 是由特征向量构成的列向量,列向量 则是线性组合的系数构成的
说明
由于矩阵 是根据微分方程组构造的,而矩阵 是由矩阵 的特征向量所构成的,所以矩阵 是可确定的,这里看作为常量
而列向量 是变量,它跟随原向量 的不同而变化
经过换元后,微分方程组从原来针对 求导,变成了对 求导,其形式如下
可以在等式两边同时乘上逆矩阵 可得
再根据矩阵对角化的公式 进一步化简
对角矩阵的解耦
由于对角矩阵只有对角线上存在元素,其他位置的元素都是
如果这种矩阵与列向量相乘
得到的结果列向量的每个元素中的变量,都只包含原来列向量的相应行的元素(变量),即对角矩阵并没有让不同行进行耦合,这样可以让结果列向量便于后续的计算
由于换元后微分方程的系数矩阵 为对角矩阵,所以如果将矩阵形式转换为方程组的形式,则每个微分方程等式中都只会包含一个变量,即 (而不像原微分方程组中,每个方程等式都包含 和 ),这样就实现了解耦
注意
进行以上变换操作需要矩阵 满足对角化的前提,即矩阵 具有 个线性不相关的特征向量
对于换元后所得的微分方程 参考前面的示例,其通解为
其中 称为矩阵指数
那么对于换元前的微分方程 其(使用矩阵指数)对应的通解为
提示
在课堂上并没有证明以上的通解表达式,它的形式也是由指数构成的,可以通过参考前面的微分方程组的示例,类推而得到该表达式
矩阵指数 Matrix exponential (其中 为矩阵),其定义可以由指数的幂级数 power series 展开形式给出
幂级数展开式
两个经典的幂级数展开形式(泰勒级数 ❓)
对于矩阵也同样适用
根据第一个经典幂级数展开式,对矩阵指数 进行定义
对于以上展开式,随着 增大(展开式靠后面的项)对应项的值会趋于 ,所以该展开式更容易收敛
另一个经典的展开式则是
对于以上展开式,如果从变量 来考虑,只有当它很小时后面的高阶项(如 、 等,会趋于 )才可以忽略不计,则可以利用该展开式求得逆矩阵的近似值
如果从矩阵 来考虑,展开式的收敛需要满足特定的条件
根据上一节课可知矩阵的幂可以分解为
则当矩阵 的各个特征值都满足 以上展开式才会收敛
对于矩阵指数 (其中 为矩阵),可以基于幂级数展开式和矩阵对角化进行转换
其中矩阵 是特征向量矩阵(由矩阵 的特征向量作为列向量构成的),矩阵 是特征值矩阵(它是一个对角矩阵,对角线上的元素是矩阵 的特征值,其他元素都是 )
注意
进行以上变换操作需要矩阵 满足对角化的前提,即矩阵 具有 个线性不相关的特征向量
证明
基于幂级数展开式和矩阵对角化对矩阵指数 (其中 为矩阵)进行转换
根据矩阵的对角化分解公式 以及高阶矩阵(矩阵的幂)的分解公式 可以将以上式子进行变换
将以上展开式的每项中的公因子 和 提出
由于 的幂级数展开式为 所以以上展开式可以进一步简化为
所以对于微分方程 的矩阵指数形式的通解可以进一步化简
由于 中的 是对角矩阵(除了对角线上的元素,其他位置上的元素都是 ),所以该矩阵指数除了幂级数展开的形式,也具有矩阵形式
与幂级数展开形式(有无数项相加)相比,它的矩阵形式仅含有限的 个元素,更便于计算
对于二阶微分方程,可以通过构造微分方程组并写成矩阵的形式,将其转换为一阶微分方程的问题,然后再根据前面小节的步骤进行求解
提示
二阶是指等式中的导数部分具有的最高导数是二阶导 而没有更高阶的导数
已知二阶微分方程
令
则以下微分方程组
可以写成矩阵形式
将系数矩阵记为 则以上等式为 它就是一阶微分方程
提示
可以将此方法进行推广,应用于含有 阶导的微分方程,通过类似的方法构造得到一个 的系数矩阵,其中原方程的系数在第一行,然后从第二行的第一个元素开始,沿着在对角线的元素为 ,其他位置的元素为