L30-奇异值分解 参考 奇异值分解 singular value decomposition,简称为 SVD,是将矩阵分解的一种方式
A = U Σ V T A=U \Sigma V^{T} 其中 A A 是任意矩阵,Σ \Sigma 是对角矩阵,U U 和 V V 是正交矩阵
对称矩阵 如果矩阵 A A 是对称矩阵,可以进行对角分解得到 A = Q Λ Q T A=Q \Lambda Q^{T} (谱定理)其中 Q Q 是正交矩阵 ,其中各个列向量由矩阵 A A 的特征向量构成
所以该分解形式是奇异值分解 A = U Σ V T A=U \Sigma V^{T} 的特殊情况,即矩阵 U U 和 V V 都是等于 Q Q (特征向量矩阵,而且是正交矩阵,即其中各列向量相互垂直)
对称矩阵的奇异值分解与对角化是一样的,而且只需要求出两个矩阵 Q Q 和 Λ \Lambda 即可进行分解,由于 Q T Q^{T} 可以直接从矩阵 Q Q 得出
对角分解 奇异值分解与矩阵对角化是对矩阵的分解的两种形式,虽然当矩阵是对称矩阵时两者是相同的,但是一般两者并不相同:
奇异值分解适用于任意矩阵 A A ;矩阵对角化适用于具有 n n 个线性独立的特征向量的矩阵 A n × n A_{n \times n} 奇异值分解 A = U Σ V T A=U \Sigma V^{T} 所得到的矩阵 U U 和 V V 是正交矩阵;矩阵对角化 A = S Λ S − 1 A=S \Lambda S^{-1} 所得到的矩阵 S S 是以矩阵 A A 的特征向量作为列向量所构成的,但是并不一定是正交矩阵 奇异值分解的起源/目的是将位于行空间 row space 里的一组正交基 v i v_{i} ,通过矩阵 A A 的线性变换,得到在列空间 column space 中的对应的一组正交基 u i u_{i} ,即满足 σ i u i = A v i \sigma_{i}u_{i}=Av_{i} (变换基,而且这些基都是正交的)
伸缩因子 在以上公式中,σ i \sigma_{i} 是一个系数,称为 stretching number 伸缩因子,因为正交基(标准向量)v i v_{i} 经过矩阵 A A 的线性变换后,所得的向量 A v i Av_{i} 不一定得到单位向量,只需要提取一个因子(其模长的倒数)写成 σ i u i \sigma_{i}u_{i} 即 u i u_{i} 则其中向量 u i u_{i} 就是单位向量
写成矩阵形式
A [ v 1 v 2 … v r ] = [ u 1 u 2 … u r ] [ σ 1 0 … 0 0 σ 2 … 0 ⋮ ⋮ ⋱ ⋮ 0 0 … σ r ] A
\begin{bmatrix}
v_{1} & v_{2} & \dots & v_{r}
\end{bmatrix}
=
\begin{bmatrix}
u_{1} & u_{2} & \dots & u_{r}
\end{bmatrix}
\begin{bmatrix}
\sigma_{1} & 0 & \dots & 0 \\
0 & \sigma_{2} & \dots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \dots & \sigma_{r}
\end{bmatrix} 即 A V = U Σ AV=U \Sigma 在等式两边同时乘上 V − 1 V^{-1} 可得 A = U Σ V − 1 A=U \Sigma V^{-1} ,由于矩阵 V V 是由正交基构成的,所以它是正交矩阵,满足 V − 1 = V T V^{-1}=V^{T} ,则等式可以写成 A = U Σ V T A=U \Sigma V^{T} 这就得到了奇异值分解的公式
在一个向量空间中,要得到一组正交向量是很简单的,只需要通过 Gram-Schmidt process 格拉姆-施密特正交化 可以从线性无关/线性独立的一系列(列)向量构造出正交基。而要实现奇异值分解的关键是找到一组在行空间 row space 里的一组正交基 v i v_{i} ,通过矩阵 A A 的线性变换后,所得到的(在列空间 column space 中)一系列向量刚好也是正交的
说明 而对于另外两个相应的向量空间,零空间 null space 和左零空间 left null space,以上公式也同样适用
例如当矩阵 A m × n A_{m \times n} 行不满秩时,则行空间 row space 的正交基数量 r < n r<n (小于 R n \mathbb{R^{n}} 的维度),相应地零空间的正交基数量就是 n − r n-r ,如果将这两个空间的正交基组合在一起,构成一个 n × n n \times n 的矩阵 V ′ = [ v 1 v 2 … v r v r + 1 ′ … v n ′ ] V^{\prime}=\begin{bmatrix} v_{1} & v_{2} & \dots & v_{r} & {\color{Red}v_{r+1}^{\prime}} & \dots & {\color{Red}v_{n}^{\prime}} \end{bmatrix}
而对于列空间 column space 的正交基数量也是 r r ,相应地左零空间的正交基数量是 m − r m-r ,如果将这两个空间的正交基组合在一起,也可以构成一个 m × m m \times m 的矩阵 U ′ = [ u 1 u 2 … u r u r + 1 ′ … u m ′ ] U^{\prime}=\begin{bmatrix} u_{1} & u_{2} & \dots & u_{r} & {\color{Red}u_{r+1}^{\prime}} & \dots & {\color{Red}u_{m}^{\prime}} \end{bmatrix}
要让添加了零空间(或左零空间)正交基的矩阵,满足奇异值分解公式 A V ′ = U ′ Σ AV^{\prime}=U^{\prime} \Sigma 其实只需要调整矩阵 Σ \Sigma 相应元素即可
由于零空间的向量 x x 满足等式 A x = 0 Ax=0 ,对于左零空间也类似,所以将矩阵 Σ m × n \Sigma_{m \times n} 相应(对角线上的)元素设置为 0 {\color{Red}0 } 即可
A [ v 1 v 2 … v r v r + 1 ′ … v n ′ ] = [ u 1 u 2 … u r u r + 1 ′ … u m ′ ] [ σ 1 0 … 0 0 0 0 0 σ 2 … 0 0 0 0 ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋮ 0 0 … σ r 0 0 0 0 0 … 0 0 0 0 ⋮ ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 … 0 0 0 0 ] A
\begin{bmatrix}
v_{1} & v_{2} & \dots & v_{r} & {\color{Red}v_{r+1}^{\prime}} & \dots & {\color{Red}v_{n}^{\prime}}
\end{bmatrix}
=
\begin{bmatrix}
u_{1} & u_{2} & \dots & u_{r} & {\color{Red}u_{r+1}^{\prime}} & \dots & {\color{Red}u_{m}^{\prime}}
\end{bmatrix}
\begin{bmatrix}
\sigma_{1} & 0 & \dots & 0 & 0 & 0 & 0 \\
0 & \sigma_{2} & \dots & 0 & 0 & 0 & 0 \\
\vdots & \vdots & \ddots & \vdots & \vdots & \vdots & \vdots \\
0 & 0 & \dots & \sigma_{r} & 0 & 0 & 0 \\
0 & 0 & \dots & 0 & {\color{Red}0 } & 0 & 0 \\
\vdots & \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\
0 & 0 & \dots & 0 & 0 & 0 & {\color{Red}0 } \\
\end{bmatrix} 例如对于以下可逆矩阵 A A
A = [ 4 4 − 3 3 ] A=
\begin{bmatrix}
4 & 4 \\
-3 & 3
\end{bmatrix} 其秩 rank 为 2 2 ,为了进行奇异值分解,需要在行空间 row space R 2 \mathbb{R^{2}} 中寻找一组正交基 v 1 v_{1} 和 v 2 v_{2} ,在列空间 column space 寻找一组正交基 u 1 u_{1} 和 u 2 u_{2} ,以及一组系数(正值)σ 1 \sigma_{1} 和 σ 2 \sigma_{2} ,使得以下等式成立
{ A v 1 = σ 1 u 1 A v 2 = σ 2 u 2 \begin{aligned}
\left\{\begin{matrix}
Av_{1}=\sigma_{1}u_{1} \\
Av_{2}=\sigma_{2}u_{2}
\end{matrix}\right.
\end{aligned} 写成矩阵形式 A V = U Σ AV=U \Sigma
在等式 A V = U Σ AV=U \Sigma 两边同时乘上 V − 1 V^{-1} 可得 A = U Σ V − 1 A=U \Sigma V^{-1} ,由于 V V 是正交矩阵(各列向量相互垂直),所以 V − 1 = V T V^{-1}=V^{T} ,则等式 A = U Σ V − 1 A=U \Sigma V^{-1} 可以写成 A = U Σ V T A=U \Sigma V^{T} 就实现了奇异值分解
在求解(奇异值分解后的)各个矩阵时,通过对等式 A = U Σ V T A=U \Sigma V^{T} 的变换,消去部分的矩阵,以降低求解的难度
提示 根据等式 A = U Σ V T A=U \Sigma V^{T} 可得矩阵 A A 的转置为 A T = ( U Σ V T ) T = ( V T ) T Σ T U T = V Σ T U T A^{T}=(U \Sigma V^{T})^{T}=(V^{T})^{T} \Sigma^{T} U^{T}=V \Sigma^{T} U^{T}
求解矩阵 V V 时,可以在等式两边同时乘上 A T = V Σ T U T A^{T}=V \Sigma^{T} U^{T} A T A = V Σ T U T U Σ V T A^{T}A=V \Sigma^{T} U^{T} U \Sigma V^{T} 由于矩阵 U U 是正交矩阵,则 U T = U − 1 U^{T}=U^{-1} 所以以上等式可以进一步化简A T A = V Σ T U T U Σ V T = V Σ T U − 1 U Σ V T = V Σ T Σ V T \begin{aligned}
A^{T}A&=V \Sigma^{T} U^{T} U \Sigma V^{T} \\
&=V \Sigma^{T} U^{-1} U \Sigma V^{T} \\
&=V \Sigma^{T} \Sigma V^{T}
\end{aligned} 由于矩阵 Σ 2 × 2 \Sigma^{2 \times 2} 是对角矩阵(除了对角线上的元素,其他元素都是 0 0 ),则 Σ = Σ T \Sigma=\Sigma^{T} 所以以上等式可以进一步化简A T A = V Σ T Σ V T = V Σ 2 V T = V [ σ 1 2 0 0 σ 2 2 ] V T \begin{aligned}
A^{T}A&=V \Sigma^{T} \Sigma V^{T} \\
&=V \Sigma^{2} V^{T} \\
&=V
\begin{bmatrix}
\sigma_{1}^{2} & 0 \\
0 & \sigma_{2}^{2}
\end{bmatrix}
V^{T}
\end{aligned} 由于 A T A A^{T}A 是对称矩阵,所以以上等式其实就是对称矩阵的对角化 Q Λ Q T Q \Lambda Q^{T} 形式 所以矩阵 V V 就是对称矩阵 A T A A^{T}A 的特征向量矩阵 求解矩阵 U U 时,类似地,可以通过构造矩阵 A A T AA^{T} 来消去矩阵 V V ,矩阵 U U 是对称矩阵 A A T AA^{T} 的特征向量矩阵 矩阵 Σ 2 \Sigma^{2} 是对称矩阵 A T A A^{T}A (或 A T A A^{T}A )的特征值矩阵。 所以矩阵 Σ \Sigma 是对角矩阵,其对角线上的元素是对称矩阵 A T A A^{T}A (或 A T A A^{T}A )的特征值矩阵对角线上元素的正平方根 AB 与 BA 具有相同特征值 矩阵 Σ 2 \Sigma^{2} 是对称矩阵 A T A A^{T}A 或 A T A A^{T}A 的特征值矩阵,也就是说矩阵 A T A A^{T}A 与 A T A A^{T}A 具有相同的特征值。
其中对于任意可逆矩阵 B B ,矩阵 A B AB 与 B A BA 都是具有相同特征值
证明方法参考这一篇文章
分别通过特征方程 d e t ( A B − λ I ) = 0 det(AB-\lambda I)=0 和 d e t ( B A − λ I ) = 0 det(BA-\lambda I)=0 求出矩阵 A B AB 和 B A BA 的所有特征值
由于矩阵 B B 是可逆矩阵,所以存在 B − 1 B^{-1} ,且 d e t ( B − 1 ) ≠ 0 det(B^{-1}) \neq 0
根据行列式特性9 可知 d e t ( A B − λ I ) d e t ( B − 1 ) = d e t ( ( A B − λ I ) B − 1 ) = d e t ( A − λ B − 1 ) det(AB-\lambda I)det(B^{-1})=det((AB-\lambda I)B^{-1})=det(A-\lambda B^{-1}) ,同理可知 d e t ( B − 1 ) d e t ( B A − λ I ) = d e t ( B − 1 ( B A − λ I ) ) = d e t ( A − λ B − 1 ) det(B^{-1})det(BA-\lambda I)=det(B^{-1}(BA-\lambda I))=det(A-\lambda B^{-1})
所以 d e t ( A B − λ I ) d e t ( B − 1 ) = d e t ( A − λ B − 1 ) = d e t ( B − 1 ) d e t ( B A − λ I ) det(AB-\lambda I)det(B^{-1})=det(A-\lambda B^{-1})=det(B^{-1})det(BA-\lambda I)
由于 d e t ( B − 1 ) ≠ 0 det(B^{-1}) \neq 0 所以 d e t ( A B − λ I ) = d e t ( B A − λ I ) det(AB-\lambda I)=det(BA-\lambda I) 所以对于任意满足特征方程 d e t ( A B − λ I ) = 0 det(AB-\lambda I)=0 的特征值 λ i \lambda_{i} 也满足特征方程 d e t ( B A − λ I ) = 0 det(BA-\lambda I)=0 即矩阵 A B AB 与 B A BA 具有相同的特征值
另一种解法 也可以先通过构造矩阵 A T A A^{T}A 求出矩阵 V V 和 Σ \Sigma
然后再通过 A V = U Σ AV=U\Sigma 来求出矩阵 U U
对于以上示例,矩阵 A = [ 4 4 − 3 3 ] A=\begin{bmatrix} 4 & 4 \\ -3 & 3 \end{bmatrix}
通过构造对称矩阵 A T A A^{T}A 求解矩阵 V V A T A = [ 4 − 3 4 3 ] [ 4 4 − 3 3 ] = [ 25 7 7 25 ] \begin{aligned}
A^{T}A&=
\begin{bmatrix}
4 & -3 \\
4 & 3
\end{bmatrix}
\begin{bmatrix}
4 & 4 \\
-3 & 3
\end{bmatrix} \\
&=
\begin{bmatrix}
25 & 7 \\
7 & 25
\end{bmatrix}
\end{aligned} 根据特征值和特征向量的定义,它们需要满足等式 A x = λ x Ax=\lambda x ,观察矩阵 A T A = [ 25 7 7 25 ] A^{T}A=\begin{bmatrix} 25 & 7 \\ 7 & 25 \end{bmatrix} 的结构 可知当 x = [ 1 1 ] x=\begin{bmatrix} 1 \\ 1 \end{bmatrix} 时,A x = [ 32 32 ] Ax=\begin{bmatrix} 32 \\ 32 \end{bmatrix} ,可以提取该向量的因子 32 32 可得A x = [ 25 7 7 25 ] [ 1 1 ] = 32 [ 1 1 ] \begin{aligned}
Ax&=
\begin{bmatrix}
25 & 7 \\
7 & 25
\end{bmatrix}
\begin{bmatrix}
1 \\
1
\end{bmatrix}
&=32
\begin{bmatrix}
1 \\
1
\end{bmatrix}
\end{aligned} 所以特征值是 32 32 同理,观察矩阵 A T A A^{T}A 的结构,可知当 x = [ 1 − 1 ] x=\begin{bmatrix} 1 \\ -1 \end{bmatrix} 时,A x = [ 18 − 18 ] Ax=\begin{bmatrix} 18 \\ -18 \end{bmatrix} ,可以提取该向量的因子 18 18 作为特征值 将以上特征向量 [ 1 1 ] \begin{bmatrix} 1 \\ 1 \end{bmatrix} 和 [ 1 − 1 ] \begin{bmatrix} 1 \\ -1 \end{bmatrix} 进行标准化,可以得到一组正交基 v 1 = [ 1 / 2 1 / 2 ] v_{1}=\begin{bmatrix} 1/ \sqrt{2} \\ 1/ \sqrt{2} \end{bmatrix} 和 v 2 = [ 1 / 2 − 1 / 2 ] v_{2}=\begin{bmatrix} 1/ \sqrt{2} \\ -1/ \sqrt{2} \end{bmatrix} 它们构成矩阵 V V 矩阵 A T A A^{T}A 的特征值构成矩阵 Σ \Sigma 的平方Σ 2 = [ σ 1 2 0 0 σ 1 2 ] = [ 32 0 0 18 ] \Sigma^{2}=
\begin{bmatrix}
\sigma_{1}^{2} & 0 \\
0 & \sigma_{1}^{2}
\end{bmatrix}=
\begin{bmatrix}
32 & 0 \\
0 & 18
\end{bmatrix} 所以矩阵 Σ \Sigma 为Σ = [ 4 2 0 0 3 2 ] \Sigma=
\begin{bmatrix}
4 \sqrt{2} & 0 \\
0 & 3 \sqrt{2}
\end{bmatrix} 提示 也可以适用特征方程 d e t ( A T A − λ I ) = 0 det(A^{T}A-\lambda I)=0 求解特征值
通过构造对称矩阵 A A T AA^{T} 求解矩阵 U U A A T = [ 4 4 − 3 3 ] [ 4 − 3 4 3 ] = [ 32 0 0 18 ] \begin{aligned}
AA^{T}&=
\begin{bmatrix}
4 & 4 \\
-3 & 3
\end{bmatrix}
\begin{bmatrix}
4 & -3 \\
4 & 3
\end{bmatrix} \\
&=
\begin{bmatrix}
32 & 0 \\
0 & 18
\end{bmatrix}
\end{aligned} 同理,观察矩阵 A A T AA^{T} 的结构,可以直接找到满足 A x = λ x Ax=\lambda x 的向量(和特征值),特征向量分别是 u 1 = [ 1 0 ] u_{1}=\begin{bmatrix} 1 \\ 0 \end{bmatrix} 和 u 2 = [ 0 1 ] u_{2}=\begin{bmatrix} 0 \\ 1 \end{bmatrix} ⚠️ 但是考虑到前面所得的向量 v 2 = [ 1 / 2 − 1 / 2 ] v_{2}=\begin{bmatrix} 1/ \sqrt{2} \\ -1/ \sqrt{2} \end{bmatrix} 则 A v 2 = [ 4 4 − 3 3 ] [ 1 / 2 − 1 / 2 ] = [ 0 − 3 2 ] Av_{2}=\begin{bmatrix} 4 & 4 \\ -3 & 3 \end{bmatrix} \begin{bmatrix} 1/ \sqrt{2} \\ -1/ \sqrt{2} \end{bmatrix}= \begin{bmatrix} 0 \\ -3 \sqrt{2} \end{bmatrix} 而 σ 2 = 3 2 \sigma_{2}=3\sqrt{2} 是正数,那么对应地 u 2 u_{2} 应该是负数,才可以让 A v 2 = σ 2 u 2 Av_{2}=\sigma_{2} u_{2} 成立,所以另一个特征向量应该取 u 2 = [ 0 − 1 ] u_{2}=\begin{bmatrix} 0 \\ -1 \end{bmatrix} 所以矩阵 A A 的奇异值分解形式为
A = U Σ V T = [ 1 0 0 − 1 ] [ 4 2 0 0 3 2 ] [ 1 / 2 1 / 2 1 / 2 − 1 / 2 ] \begin{aligned}
A&=U \Sigma V^{T} \\
&=
\begin{bmatrix}
1 & 0 \\
0 & -1
\end{bmatrix}
\begin{bmatrix}
4 \sqrt{2} & 0 \\
0 & 3 \sqrt{2}
\end{bmatrix}
\begin{bmatrix}
1/ \sqrt{2} & 1/ \sqrt{2} \\
1/ \sqrt{2} & -1/ \sqrt{2}
\end{bmatrix}
\end{aligned} 对于不可逆(奇异)矩阵,则奇异值分解公式 A = U Σ V T A=U \Sigma V^{T} 中,矩阵 U U 和 V V 会包含零空间和左零空间的标准正交基 ,在矩阵 Σ \Sigma 中对角线上的相应元素为 0 0
例如对于以下奇异矩阵 A A
A = [ 4 3 8 6 ] A=
\begin{bmatrix}
4 & 3 \\
8 & 6
\end{bmatrix} 这个不可逆矩阵在行空间 row space 和列空间 column space 都只有一维,相应地零空间 nullspace 和左零空间 left nullspace 维度是 1 1
观察矩阵 A A 的结构可知,行空间可以只由(以列向量形式)[ 4 3 ] \begin{bmatrix} 4 \\ 3 \end{bmatrix} 向量张成;列空间可以只由 [ 4 8 ] \begin{bmatrix} 4 \\ 8 \end{bmatrix} 向量张成
由于行空间和列空间都只有一维,所以可以很方便地求出这些空间的正交基,只需要将以上向量转换为单位向量即可
对于行空间 [ 4 3 ] \begin{bmatrix} 4 \\ 3 \end{bmatrix} 变成单位向量 v 1 = [ 4 / 4 2 + 3 2 3 / 4 2 + 3 2 ] = [ 4 / 5 3 / 5 ] = [ 0.8 0.6 ] v_{1}=\begin{bmatrix} 4/ \sqrt{4^{2}+3^{2}} \\ 3 / \sqrt{4^{2}+3^{2}} \end{bmatrix}=\begin{bmatrix} 4/5 \\ 3 /5\end{bmatrix}=\begin{bmatrix} 0.8 \\ 0.6 \end{bmatrix}
对于列空间,同理将 [ 4 8 ] \begin{bmatrix} 4 \\ 8 \end{bmatrix} 变成单位向量 u 1 = [ 1 / 5 2 / 5 ] u_{1}=\begin{bmatrix} 1/\sqrt{5} \\ 2/\sqrt{5} \end{bmatrix}
由于零空间 nullspace 与行空间 row space 这两个子空间正交 orthogonal,所以这两个空间的向量均相互垂直 ,则通过行空间的正交基,可以很方便地求出零空间的正交基 [ 0.6 − 0.8 ] \begin{bmatrix} 0.6 \\ -0.8 \end{bmatrix} ,作为 v 2 v_{2}
同理可以求出左零空间 left nullspace 的正交基 [ 2 / 5 − 1 / 5 ] \begin{bmatrix} 2/\sqrt{5} \\ -1/\sqrt{5} \end{bmatrix} ,作为 u 2 u_{2}
而求解矩阵 Σ \Sigma 时,可以构造任意一个对称矩阵(A T A A^{T}A 或 A A T AA^{T} )
A T A = [ 4 8 3 6 ] [ 4 3 8 6 ] = [ 80 60 60 45 ] \begin{aligned}
A^{T}A&=
\begin{bmatrix}
4 & 8 \\
3 & 6
\end{bmatrix}
\begin{bmatrix}
4 & 3 \\
8 & 6
\end{bmatrix} \\
&=
\begin{bmatrix}
80 & 60 \\
60 & 45
\end{bmatrix}
\end{aligned} 由于矩阵 A T A A^{T}A 不满秩(第一行向量与第二行向量线性相关),它的秩 rank 为 1 1 ,所以它必然由一个特征值为零 λ 1 = 0 \lambda_{1}=0 ,再根据特征值之和为矩阵的迹 λ 1 + λ 2 = 80 + 45 = 125 \lambda_{1}+\lambda_{2}=80+45=125 所以另一个特征值为 λ 2 = 125 \lambda_{2}=125
则矩阵 Σ \Sigma 为
Σ = [ 125 0 0 0 ] \Sigma=
\begin{bmatrix}
\sqrt{125} & 0 \\
0 & 0
\end{bmatrix} 则可逆矩阵 A A 的奇异值分解为
A = U Σ V T = [ 1 / 5 2 / 5 2 / 5 − 1 / 5 ] [ 125 0 0 0 ] [ 0.8 0.6 0.6 − 0.8 ] \begin{aligned}
A&=U \Sigma V^{T} \\
&=
\begin{bmatrix}
1/\sqrt{5} & 2/\sqrt{5} \\
2/\sqrt{5} & -1/\sqrt{5}
\end{bmatrix}
\begin{bmatrix}
\sqrt{125} & 0 \\
0 & 0
\end{bmatrix}
\begin{bmatrix}
0.8 & 0.6 \\
0.6 & -0.8
\end{bmatrix}
\end{aligned} 对于一般矩阵(可能是可逆矩阵),奇异值分解 A = U Σ V T A=U \Sigma V^{T} 的作用是通过矩阵 A A 将向量 v i v_{i} 线性变换为向量 u i u_{i} ,该操作将四个基本子空间联系起来了
其中这些向量是位于四个基本子空间的正交基:
向量 v 1 , v 2 , … v r v_{1}, v_{2}, \dots v_{r} 是行空间的标准正交基(行空间的维度是 r r ),而向量 v r + 1 , … v n v_{r+1}, \dots v_{n} 是零空间的标准正交基(零空间的维度是 n − r n-r ) 向量 u 1 , u 2 , … u r u_{1}, u_{2}, \dots u_{r} 是列空间的标准正交基(列空间的维度是 r r ),而向量 u r + 1 , … u m u_{r+1}, \dots u_{m} 是左零空间的标准正交基(左零空间的维度是 m − r m-r )