L31-线性变换及对应矩阵
参考
线性变换 linear Transformation 操作记作 ,它需要满足以下两个公式
其中 为输入值,经过线性变换 的转换,得到输出值 (可以将 和 看作自变量和因变量,则 就是函数)
提示
可以将线性变换理解为对于 相加(公式一) 和 数乘(公式二) 的操作运算是「闭合/封闭」的
将以上定义中的两个公式整合为一个公式 ,其中 和 是标量,表示 scalar 变量的缩放系数
线性变换的零点
对于任何线性变换,如果它们的输入值可以为 ,则经过线性转换后其结果必然为
因为线性变换需要满足公式 解得
- 示例 1:投影操作是一种线性变换,例如将 平面内的一个向量变成/映射为另一个向量(总是在一条直线 上) 其中 是映射规则,即每一个向量 投影结果为 (在直线 上)
- 反例 1:向量与一个固定大小的向量 相加的变换 ,则不是一种线性变换,由于不一定满足线性变换定义中的第二个等式,即
- 反例 2:求向量长度的操作并不是一种线性变换, 例如向量 在 空间中,则该变换可以实现向量从三维空间 到一维 空间的映射。虽然满足 ,但是对于数乘,如果系数 为负数,则不满足公式
- 示例 2:旋转 的操作是一个线性变换,例如将 平面内的向量 旋转 得到的结果向量是 ,线性变换实现了一种映射
几何角度
以上示例和反例对于变换的描述都不依赖坐标系,只是从几何角度来研究线性变换,这样可以从整体来看待线性变换,而不是聚焦于其中一个坐标点,更容易理解线性变换的作用
如果引入坐标系来描述 linear transformation 线性变换,则每个线性变换都可以生成/对应到一个矩阵,相应地每一种线性变换都是对一个矩阵乘法运算 的一种抽象描述
当向量 右乘该矩阵时,矩阵的作用可以理解为对该向量进行变换,得到的结果 就是线性变换的结果
根据线性变换的定义,该矩阵需要满足以下的两个公式
- 示例 1:矩阵 所描述的一种线性变换是关于 轴对称,因为将一个在 空间的向量 与矩阵(右乘)相乘时,所得到的结果向量为 它的横坐标值保持不变,纵坐标值与原向量相反,则线性变换 表示 平面关于 轴的对称操作(从几何角度来理解该线性变换/矩阵的作用/效果)
- 示例 2:假设 表示一种线性变换 可以实现将输入的三维空间的向量,转换输出为二维空间的向量。如果用矩阵 来表示这种线性变换 ,根据矩阵的乘法法则,可得矩阵的形状为
补充知识
对于输入空间(输入向量所在的空间)的一组基向量 ,若已知它们线性变换后的对应结果
则可以计算出该输入空间中的任何一个向量 的线性变换结果
证明
因为向量 可以用这一组基向量来表示 ,则该向量线性变换的结果可以拆解为 根据线性变换的定理(所满足的公式)可得
由于已知各个基向量对应的线性变换结果 ,所以可以求得 ,即任意向量 线性变换的结果
也就是说如果要描述一个线性变换 (它将任意 的 维向量映射为 维向量),只需要知道 空间的一组基向量,以及它们对应的变换结果即可。然后在 中的任意一个向量 的线性变换结果 ,可以通过这些信息计算出来
在前面的「补充知识」分析中,可以使用一组基向量及其相应的变换结果来描述 linear transformation 线性变换,它不基于坐标系,但只需要将表达形式稍作调整,就可以得到基于坐标系的方式,即采用一个矩阵 来描述线性变换
坐标系
其实向量 的坐标形式是源自一组基向量的。
例如对于任意向量 如果采用一组基向量 来表示为 那么各个基向量的系数就构成了该向量的坐标 ,即向量的坐标值反映的是一组基向量的线性组合
坐标系一般建立在标准基之上,即采用相互正交、模长为 的向量作为基向量,例如向量 是由以下一系列基向量构成的
使用一个矩阵 表示/描述一种线性变换 需要执行以下步骤:
- 首先需要引入坐标系(即将向量表示为坐标值形式)
根据以上「坐标系」的介绍,需要分别为空间 和空间 选取一组基向量,以表示空间中的任意向量- 空间中的一组基向量为
- 空间中的一组基向量为
则这两个空间中的任意向量的坐标值形式为- 空间中的任意向量
- 空间中的任意向量
- 构建出表示线性变换的矩阵
由于线性变换的作用是将原向量 映射到 空间中,那么所得的结果向量 可以使用 空间中的一组基向量 来表示,例如对于第一个基向量 进行线性变换,可以将结果向量表示为
根据前面「补充知识」里的分析,为了描述一个线性变换,需要确定一组基向量,并知道它们相应的变换结果,所以还需要计算 空间中的一组基向量为 的线性变换结果(用 空间中的一组基向量表示)
类比向量「坐标化」的方法,提取各个基向量的系数构成了矩阵 中各个元素的值,其规则是- 第一个基向量 线性变换所得的结果表达式中的系数作为矩阵 的第一列
- 第二个基向量 线性变换所得的结果表达式中的系数作为矩阵 的第一列
- 依此类推
证明
假设向量空间采用标准正交向量作为基向量,即 (除了第 个元素为 ,其他元素都是 )
则基向量与矩阵 相乘可得
将结果向量的「坐标值」形式转换为「基向量」形式,即
所以对于 空间中的这一组基向量 ,该矩阵满足
那么对于 空间中的任意向量 ,满足 即可以使用该矩阵 来表示线性变换操作
提示
对于 空间中的任意向量 使用一组基向量来表示
则它的线性变换结果 可以拆分为
根据线性变换的规则,可以将前面的公式化简为 再将 代入可得
将上述的公式化简可得 即可以使用该矩阵 来表示 空间中的任意向量 的线性变换操作
投影矩阵对应于一种线性变换操作,例如对于 空间中的投影矩阵,其作用是将平面的任意向量投影到一条直线上
为了简化运算,所选取沿投影直线 方向的单位向量 ,以及垂直于直线 方向的单位向量 作为一组基向量。由于投影后的向量在同一个平面里,所以可以采用相同的一组基向量来描述结果空间,即 (实际上在直线上的向量只需要一个基向量 就可以表示),这一组基向量满足投影后保持不变
说明
可以从几何角度知道在直线上的基向量 的投影结果与自身相同,即 ;而垂直于直线的基向量 其投影结果为
根据以上等式,提取各个基向量的系数,可以构建出矩阵
所得到的矩阵正好是一个对角矩阵 。如果所选取的一组基向量正好是该矩阵的特征向量,则线性变换所对应的矩阵是对角矩阵,其对角线上的元素就是特征值( ❓ 先有鸡还是先有蛋的问题)
提示
也可以从矩阵乘法的角度来考虑
对于平面中的任意向量 用这一组基向量可表示为
那么该向量的投影结果为 可以拆分为
由于 所以向量 的投影结果为
将以上的向量写成「坐标值」形式,
则投影矩阵就是 使得线性变换操作 成立
基向量的选择
由于向量的坐标值形式对应于一组基向量的线性组合,所以向量的坐标值与所在空间所选取的基向量相关,选择不同的一组基向量,向量所得到的坐标值形式也会变化
一般默认选择一组标准正交基作为基向量,例如对于 平面,通常选择横轴 和纵轴 方向的向量作为基向量
但有时候选取其他合适的一组基向量可以简化运算,所以不是所有场景都适合选择标准正交基作为基向量
例如对于以上投影矩阵的例子,如果选取标准正交向量作为基向量 如果投影到与横轴夹角是 的直线上,则投影矩阵就比较复杂了(根据之前课程的投影矩阵的公式可以求得)
求导也是一种线性变换
例如对二次幂多项式进行求导操作 输入空间是所有可能的二次幂多项式组合,可以选择 作为一组基;输出空间则是所有可能的一次幂多项式组合,可以选择 作为该空间的一组基
那么多项式就可以表示为一个向量,二次幂多项式求导操作可以用以下公式表示
根据上式以及矩阵的乘法法则,可以求出矩阵
在课堂的最后还提到两个定理
如果线性变换是存在「可逆操作」的,则表示该线性变换的矩阵就是可逆的(具有逆矩阵)
两个线性变换的乘积,可以对应于两个矩阵的乘积