一、A = LU
线性代数很多关键的概念实际上就是矩阵的分解(factorization)。原始矩阵 A A A 变成两个或三个特殊矩阵的乘积。第一个分解,实际上也是最重要的分解,来自消元法。因子 L L L 和 U U U 都是三角形矩阵,分解 A = L U A=LU A=LU 来自消元法。
矩阵 U U U 是上三角矩阵,它的主元都在对角线上,消元步骤将 A A A 变为 U U U。现在我们要反向这些步骤(将 U U U 变为 A A A ),通过一个下三角矩阵 L L L 就可以。 L L L 的元素正好就是乘数 l i j l_{ij} lij —— 从行 i i i 减去乘数乘主元行 j j j。
以 2 × 2 2×2 2×2 的矩阵为例,矩阵 A A A 有四个元素 2 , 1 , 6 , 8 2,1,6,8 2,1,6,8,要消去的元素是 6 6 6。从行 2 2 2 减去 3 3 3 乘行 1 1 1,这个正向步骤使用消元矩阵 E 21 E_{21} E21,乘数 l 21 = 3 l_{21}=3 l21=3。从 U U U 到 A A A 的反向步骤使用 L = E 21 − 1 L=E^{-1}_{21} L=E21−1(行 2 2 2 加上 3 3 3 乘行 1 1 1)。 正向从 A 到 U : E 21 A = [ 1 0 − 3 1 ] [ 2 1 6 8 ] = [ 2 1 0 5 ] = U 反向从 U 到 A : E 21 − 1 U = [ 1 0 3 1 ] [ 2 1 0 5 ] = [ 2 1 6 8 ] = A 正向从\,A\,到\,U:\kern 5ptE_{21}A=\begin{bmatrix}1&0\\-3 &1\end{bmatrix}\begin{bmatrix}2&1\\6&8\end{bmatrix}=\begin{bmatrix}2&1\\0&5\end{bmatrix}=U\\[1ex]反向从\,U\,到\,A:\kern 5ptE_{21}^{-1}U=\begin{bmatrix}1&0\\3&1\end{bmatrix}\begin{bmatrix}2&1\\0&5\end{bmatrix}=\begin{bmatrix}2&1\\6&8\end{bmatrix}=A 正向从A到U:E21A=[1−301][2618]=[2015]=U反向从U到A:E21−1U=[1301][2015]=[2618]=A上面第二行就是分解 L U = A LU=A LU=A,将 E 21 − 1 E_{21}^{-1} E21−1 用 L L L 代替。更大的矩阵会有很多 E ′ s E's E′s, L \pmb L L 包含它们所有的逆矩阵。
A A A 到 U U U 的每一个步骤都要左乘一个矩阵 E i j E_{ij} Eij,将位置 ( i , j ) (i,j) (i,j) 的元素变为 0 0 0。为了清晰起见,假设没有行交换,如果 A A A 是 3 × 3 3×3 3×3 的矩阵,需要在左边依次乘 E 21 E_{21} E21, E 31 E_{31} E31, E 32 E_{32} E32,乘数 l i j l_{ij} lij 将会使得位置 ( 2 , 1 ) (2,1) (2,1), ( 3 , 1 ) (3,1) (3,1), ( 3 , 2 ) (3,2) (3,2) 位置处的元素都变为 0 0 0,它们都在对角线下方,消元法在得到一个上三角矩阵后结束。
现在将 E ′ s E's E′s 移到另外一边,将它们的逆矩阵乘上 U U U:
( E 32 E 31 E 21 ) A = U 变为 A = ( E 21 − 1 E 31 − 1 E 32 − 1 ) U 就是 A = L U ( 2.6.1 ) (E_{32}E_{31}E_{21})A=U\kern 10pt变为\kern 10ptA=(E_{21}^{-1}E_{31}^{-1}E_{32}^{-1})U\kern 10pt就是\kern 10pt\pmb{A=LU}\kern 10pt(2.6.1) (E32E31E21)A=U变为A=(E21−1E31−1E32−1)U就是A=LU(2.6.1)
逆矩阵是反序相乘,三个逆矩阵的乘积就是 L L L。我们得到了 A = L U A=LU A=LU。
二、解释与例子
第一点:每一个逆矩阵 E − 1 E^{-1} E−1 都是下三角矩阵。它的非主对角线元素是 l i j l_{ij} lij,用来恢复 − l i j -l_{ij} −lij 产生的减法。 E E E 和 E − 1 E^{-1} E−1 的主对角线都是 1 1 1。上面的例子中 l 21 = 3 l_{21}=3 l21=3, E = [ 1 0 − 3 1 ] E=\begin{bmatrix}1&0\\-3&1\end{bmatrix} E=[1−301], L = E − 1 = [ 1 0 3 1 ] L=E^{-1}=\begin{bmatrix}1&0\\3&1\end{bmatrix} L=E−1=[1301]。
第二点:式(2.6.1)展示了一个下三角矩阵( E i j E_{ij} Eij 的乘积)乘 A A A,也展示了所有的 E i j − 1 E_{ij}^{-1} Eij−1 乘 U U U 会得到 A A A。 E i j \pmb{E_{ij}} Eij 的逆矩阵的乘积得到的下三角矩阵就是 L \pmb L L。
我们处理这些逆矩阵的一个原因是想要分解 A A A,而不是 U U U。它的 “反向形式” 得到了 A = L U A=LU A=LU。另一个原因是我们会得到更多的信息, L L L 是一个很好的矩阵,这也是第三点。
第三点:每个乘数 l i j l_{ij} lij 可以直接放入 L L L 的 ( i , j ) (i,j) (i,j) 位置,不需要改变。通常矩阵的乘法会将这些位置弄乱,但是在 L L L 里不会。因为逆矩阵的正确顺序,使得 l l l 没有发生变化。在式(2.6.3)中会给出原因。
第四点:每个 E − 1 E^{-1} E−1 的对角线都是 1 1 1, L L L 也是如此。
A = L U 消元过程中没有行交换 . 上三角矩阵 U 的 主元在它的对角线上 . 下三角矩阵 L 的主 元都是 1 ,乘数 l i j 在 L 的对角线下方 . \begin{matrix}A=LU\end{matrix}\kern 15pt\begin{matrix}\pmb{消元过程中没有行交换}.上三角矩阵\,U\,的\\主元在它的对角线上.下三角矩阵\,L\,的主\\元都是\,1\,,乘数\,l_{ij}\,在\,L\,的对角线下方.\end{matrix} A=LU消元过程中没有行交换.上三角矩阵U的主元在它的对角线上.下三角矩阵L的主元都是1,乘数lij在L的对角线下方.
【例1】消元法从行 2 2 2 减去 1 2 \displaystyle\frac{1}{2} 21 乘行 1 1 1,最后一步从行 3 3 3 减去 2 3 \displaystyle\frac{2}{3} 32 乘行 2 2 2。下三角矩阵 L L L 有 l 21 = 1 2 l_{21}=\displaystyle\frac{1}{2} l21=21, l 32 = 2 3 l_{32}=\displaystyle\frac{2}{3} l32=32。 L U LU LU 的乘积得到 A A A: A = [ 2 1 0 1 2 1 0 1 2 ] = [ 1 0 0 1 2 1 0 0 2 3 1 ] [ 2 1 0 0 3 2 1 0 0 4 3 ] = L U A=\begin{bmatrix}2&1&0\\1&2&1\\0&1&2\end{bmatrix}=\begin{bmatrix}1&0&0\\\displaystyle\frac{1}{2}&1&0\\0&\displaystyle\frac{2}{3}&1\end{bmatrix}\begin{bmatrix}2&1&0\\0&\displaystyle\frac{3}{2}&1\\0&0&\displaystyle\frac{4}{3}\end{bmatrix}=LU A= 210121012 = 12100132001 20012300134 =LU因为 A A A 的 ( 3 , 1 ) (3,1) (3,1) 元素是 0 0 0,所以 ( 3 , 1 ) (3,1) (3,1) 位置的乘数是 0 0 0,即不需要进行操作。
【例2】将 A A A 左上角的元素 2 2 2 改为 1 1 1,变成 B B B。则所有的主元都是 1 1 1,所有的乘数也是 1 1 1。保持这种模式,当 B B B 是 4 × 4 4\times4 4×4 的矩阵时: B = [ 1 1 0 0 1 2 1 0 0 1 2 1 0 0 1 2 ] = [ 1 1 1 0 1 1 0 0 1 1 ] [ 1 1 0 0 1 1 0 1 1 1 ] B=\begin{bmatrix}1&1&0&0\\1&2&1&0\\0&1&2&1\\0&0&1&2\end{bmatrix}=\begin{bmatrix}1&&&\\1&1&&\\0&1&1&\\0&0&1&1\end{bmatrix}\begin{bmatrix}1&1&0&0\\&1&1&0\\&&1&1\\&&&1\end{bmatrix} B= 1100121001210012 = 1100110111 1110110011 假设没有行交换,如何可以得知 L L L 和 U U U 中哪些元素为 0 0 0 呢? 当 A 的某一行从 0 开始,则 L 的该行也从 0 开始 当 A 的某一列从 0 开始,则 U 的该列也从 0 开始 \pmb{当\,A\,的某一行从\,0\,开始,则\,L\,的该行也从\,0\,开始}\\\pmb{当\,A\,的某一列从\,0\,开始,则\,U\,的该列也从\,0\,开始} 当A的某一行从0开始,则L的该行也从0开始当A的某一列从0开始,则U的该列也从0开始如果某一行从 0 0 0 开始,那么就不需要消元, L L L 相应的位置就是 0 0 0,这将节省电脑的时间。同样的,如果某一列从 0 0 0 开始, U U U 相应的位置也为 0 0 0。但是,如果 0 0 0 在中间,因为消元法是前向消除,这些位置在 L L L 或 U U U 的对应的位置大概率就不再是 0 0 0。那么为什么 L L L 相应的位置是乘数 l i j l_{ij} lij,而不发生混乱呢?
关键原因是 A \pmb A A 为什么等于 L U \pmb{LU} LU:当主元行下方的行减去时,它们还是 A A A 的原始行吗?不是!因为在消元过程中它们被改变了。那么它们是 U U U 的行吗?是的!因为主元不再改变。当计算 U U U 的第三行时,我们会减去乘数乘 U U U 前面的行(不是 A A A 的行): R o w 3 o f U = ( R o w 3 o f A ) − l 31 ( R o w 1 o f U ) − l 32 ( R o w 2 o f U ) ( 2.6.2 ) Row\,\,3\,\,of\,\,U=(Row\,\,3\,\,of\,\,A)-l_{31}(Row\,\,1\,\,of\,\,U)-l_{32}(Row\,\,2\,\,of\,\,U)\kern 19pt(2.6.2) Row3ofU=(Row3ofA)−l31(Row1ofU)−l32(Row2ofU)(2.6.2)改写这个方程,看看行 [ l 31 l 32 1 ] \begin{bmatrix}l_{31}&l_{32}&1\end{bmatrix} [l31l321] 是如何与 U U U 相乘的: ( R o w 3 o f A ) = l 31 ( R o w 1 o f U ) + l 32 ( R o w 2 o f U ) + 1 ( R o w 3 o f U ) ( 2.6.3 ) (Row\,\,3\,\,of\,\,A)=l_{31}(Row\,\,1\,\,of\,\,U)+l_{32}(Row\,\,2\,\,of\,\,U)+1(Row\,\,3\,\,of\,\,U)\kern 10pt(2.6.3) (Row3ofA)=l31(Row1ofU)+l32(Row2ofU)+1(Row3ofU)(2.6.3)正好就是 ( A = L U ) (A=LU) (A=LU) 的第三行。 L L L 的行 3 3 3 的分量是 l 31 l_{31} l31, l 32 l_{32} l32, 1 1 1。无论 A A A 有多大,所有的行都是这样。如果没有行交换,则有 A = L U A=LU A=LU。
平衡形式 L D U \pmb{LDU} LDU: A = L U A=LU A=LU 是不对称的,因为 U U U 的对角线上是主元,而 L L L 的对角线都是 1 1 1。将 U U U 分成一个举着 D D D 和一个新的矩阵 U U U 相乘,矩阵 D D D 是对角线矩阵,它的对角线就是 U U U 的主元,而新的矩阵 U U U 的对角线就会变成 1 1 1,其它元素除以该行的主元:
新的上三角矩阵 U U U 的对角线都是 1 1 1。与正常的 L U LU LU 不同的是,新形式中间有一个 D D D:下三角矩阵 L \pmb L L 乘对角线矩阵 D \pmb D D 乘上三角矩阵 U \pmb U U。
矩阵的三角分解可以写 A = L U 或 A = L D U 矩阵的三角分解可以写\kern 10pt\pmb{A=LU}\,或 \,\pmb{A=LDU} 矩阵的三角分解可以写A=LU或A=LDU
当看到 L D U LDU LDU 的形式时,我们就可以知道 U U U 的对角线都是 1 1 1,每一行都除以其第一个非零元素 —— 主元( L U LU LU中 U U U 的主元 ): [ 1 0 3 1 ] [ 2 8 0 5 ] 进一步分解为 [ 1 0 3 1 ] [ 2 5 ] [ 1 4 0 1 ] ( 2.6.4 ) \begin{bmatrix}1&0\\3&1\end{bmatrix}\begin{bmatrix}2&8\\0&5\end{bmatrix}\kern 10pt进一步分解为\kern 10pt\begin{bmatrix}1&0\\3&1\end{bmatrix}\begin{bmatrix}2&\\&5\end{bmatrix}\begin{bmatrix}1&4\\0&1\end{bmatrix}\kern 10pt(2.6.4) [1301][2085]进一步分解为[1301][25][1041](2.6.4)主元 2 2 2 和 5 5 5 进入了 D D D,行分别除以 2 2 2 和 5 5 5,得到新的 U U U,它的对角线都是 1 1 1。乘数 3 3 3 仍然在 L L L 内。
三、一个方形系统 = 两个三角形系统
矩阵 L L L 包含了高斯消元法的记忆,它保存了每次进行消元时的乘数。我们可以使用这些求解 A x = b A\boldsymbol x=\boldsymbol b Ax=b。
当存在右侧的 b \boldsymbol b b 时,则需要 L L L。因子 L L L 和 U U U 完全取决于左侧(矩阵 A A A)。在 A x = b A\boldsymbol x=\boldsymbol b Ax=b 的右侧,我们先使用 L − 1 L^{-1} L−1 再使用 U − 1 U^{-1} U−1。该求解步骤会处理两个三角形矩阵。
1、分解(通过对左侧的矩阵 A A A 进行消元,得到 L L L 和 U U U)
2、求解(使用 L L L 对 b \boldsymbol b b 进行前向消元,然后使用 U U U 进行回代求得 x \boldsymbol x x)
以前,我们使用增广矩阵 [ A b ] \begin{bmatrix}A&\boldsymbol b\end{bmatrix} [Ab] 同时处理 A A A 和 b \boldsymbol b b。但是电脑大多数会将两侧分开, L L L 和 U U U 都保存有消元的记忆,无论何时我们都可以处理 b \boldsymbol b b。因为这样求解一个单一的系统只需要一个子程序。
那么如何使用 b \boldsymbol b b 呢?首先对右侧使用前向消元法(乘数存储在 L L L 中,现在可以使用),它会将 b \boldsymbol b b 变成一个新的右侧 c \boldsymbol c c,我们现在求解的是 L c = b L\boldsymbol c=\boldsymbol b Lc=b,然后使用回代求解 U x = c U\boldsymbol x=\boldsymbol c Ux=c,原始系统 A x = b A\boldsymbol x=\boldsymbol b Ax=b 就被分解成了两个三角系统:
前向与反向 求解 L c = b ,然后求解 U x = c ( 2.6.5 ) \pmb{前向与反向}\kern 10pt求解\kern 5ptL\boldsymbol c=\boldsymbol b,然后求解\kern 5ptU\boldsymbol x=\boldsymbol c\kern 10pt(2.6.5) 前向与反向求解Lc=b,然后求解Ux=c(2.6.5)
要验证 x \boldsymbol x x 就是要求的解, U x = c U\boldsymbol x=\boldsymbol c Ux=c 两侧同时左乘 L L L,得到 L U x = L c LU\boldsymbol x=L\boldsymbol c LUx=Lc 就是 A x = b A\boldsymbol x=\boldsymbol b Ax=b。
强调: 这些步骤并没有新的知识。我们使用前向消元求解三角系统 L c = b L\boldsymbol c=\boldsymbol b Lc=b,然后回代求解 U x = c U\boldsymbol x=\boldsymbol c Ux=c。
【例3】以 A x = b A\boldsymbol x=\boldsymbol b Ax=b 前向消元开始,在 U x = c U\boldsymbol x=\boldsymbol c Ux=c 结束: A x = b u + 2 v = 5 4 u + 9 v = 21 变为 u + 2 v = 5 v = 1 U x = c A\boldsymbol x=\boldsymbol b\kern 10pt\begin{matrix}u+2v=5\\4u+9v=21\end{matrix}\kern 10pt变为\kern 10pt\begin{matrix}u+2v=5\\\kern 24ptv=1\end{matrix}\kern 10ptU\boldsymbol x=\boldsymbol c Ax=bu+2v=54u+9v=21变为u+2v=5v=1Ux=c乘数 4 4 4 保存在 L L L 中,右侧使用 4 4 4 将 21 21 21 变成了 1 1 1: L c = b 下三角系统 [ 1 0 4 1 ] [ c ] = [ 5 21 ] 求得 c = [ 5 1 ] L\boldsymbol c=\boldsymbol b\kern 10pt下三角系统\kern 10pt\begin{bmatrix}1&0\\4&1\end{bmatrix}[\boldsymbol c]=\begin{bmatrix}5\\21\end{bmatrix}\kern 5pt求得\kern 5pt\boldsymbol c=\begin{bmatrix}5\\1\end{bmatrix} Lc=b下三角系统[1401][c]=[521]求得c=[51] U x = c 上三角系统 [ 1 2 0 1 ] [ x ] = [ 5 1 ] 求得 x = [ 3 1 ] U\boldsymbol x=\boldsymbol c\kern 10pt上三角系统\kern 10pt\begin{bmatrix}1&2\\0&1\end{bmatrix}[\boldsymbol x]=\begin{bmatrix}5\\1\end{bmatrix}\kern 5pt求得\kern 5pt\boldsymbol x=\begin{bmatrix}3\\1\end{bmatrix} Ux=c上三角系统[1021][x]=[51]求得x=[31] L L L 和 U U U 所使用的也就是以前 A A A 所使用的 n 2 n^2 n2 的存储空间。
四、消元法的成本
这里讨论消元法的成本 —— 即计算时间的问题。我们在计算机上解方程,就需要考虑计算成本,在科学计算时我们可能会遇到大型系统,三维空间的问题就很容易有一百万个未知数,如果计算成本太高的话,我们不可能让计算机计算成百上千年。
消元法的第一阶段是将列 1 1 1 的第一主元以下的元素全部变为 0 0 0,第一行以下的元素全部都需要改变,而改变一个元素需要一次乘法和一次减法,所以第一阶段大约需要 n 2 n^2 n2 次乘法和 n 2 n^2 n2 次减法,实际上会少一些,因为第一行不变,实际上需要 n ( n − 1 ) n(n-1) n(n−1) 次乘法和加法,这里计算的是一个大致成本。
第二阶段我们需要将列 2 2 2 的第二主元下方的元素变为 0 0 0,此时我们要考虑的矩阵会小一些,是一个 ( n − 1 ) × ( n − 1 ) (n-1)\times(n-1) (n−1)×(n−1) 的矩阵,所以这一阶段大约是 ( n − 1 ) 2 (n-1)^2 (n−1)2 次乘法与减法。越往下进行所要考虑的矩阵越小,最终要得到矩阵 U U U 则粗略估计需要的次数为 n 2 + ( n − 1 ) 2 + ⋯ + 2 2 + 1 2 n^2+(n-1)^2+\cdots+2^2+1^2 n2+(n−1)2+⋯+22+12。
上式平方和的公式为 1 3 n ( n + 1 2 ) ( n + 1 ) \displaystyle\frac{1}{3}n(n+\frac{1}{2})(n+1) 31n(n+21)(n+1),当 n n n 很大时,就可以忽略里面的 1 2 \displaystyle\frac{1}{2} 21 和 1 1 1,总和大约就是 1 3 n 3 \displaystyle\frac{1}{3}n^3 31n3。 x 2 x^2 x2 从 0 0 0 到 n n n 的积分就是 1 3 n 3 \displaystyle\frac{1}{3}n^3 31n3,需要注意的是积分是连续的,而这里是离散的。
对矩阵 A 使用消元法大概需要 1 3 n 3 次乘法 和 1 3 n 3 次减法 对矩阵 A 使用消元法大概需要 \,\displaystyle\pmb{\frac{1}{3}n^3}\, \pmb{次乘法}和 \displaystyle\frac{1}{3}n^3 次减法 对矩阵A使用消元法大概需要31n3次乘法和31n3次减法
下面考虑右侧的 b \boldsymbol b b,我们要计算 L c = b L\boldsymbol c=\boldsymbol b Lc=b,得到 c \boldsymbol c c。首先,我们从 b 2 , ⋯ , b n b_2,\cdots,b_n b2,⋯,bn 减去乘数乘 b 1 b_1 b1,这里需要 n − 1 n-1 n−1 步,第二阶段就不需要考虑 b 1 b_1 b1,共需要 n − 2 n-2 n−2 步,最后一阶段需要 1 1 1 步。
最后考虑回代,通过 U x = c U\boldsymbol x=\boldsymbol c Ux=c 求解 x \boldsymbol x x。首先,计算 x n x_n xn 需要 1 1 1 步,仅需要除以最后一个主元;然后计算 x n − 1 x_{n-1} xn−1 需要 2 2 2 步,这里需要代入 x n x_n xn,然后除以第 n − 1 n-1 n−1 主元;最后计算 x 1 x_1 x1 时需要 n n n 步,要代入 ( n − 1 ) (n-1) (n−1) 个未知数,然后除以第一主元。所有计算右侧的 b \boldsymbol b b 正好需要需要 n 2 n^2 n2 步(从前到后再回代): [ ( n − 1 ) + ( n − 2 ) + ⋯ + 1 ] + [ 1 + 2 + ⋯ + ( n − 1 ) + n ] = n 2 ( 2.6.6 ) [(n-1)+(n-2)+\cdots+1]+[1+2+\cdots+(n-1)+n]=n^2\kern 10pt(2.6.6) [(n−1)+(n−2)+⋯+1]+[1+2+⋯+(n−1)+n]=n2(2.6.6)可以看到,右侧的成本要比左侧小很多。
求解 右侧需要 n 2 次乘法 和 n 2 次减法 \pmb{求解}\kern 15pt右侧需要\,\pmb{n^2\,次乘法}和\,n^2\,次减法 求解右侧需要n2次乘法和n2次减法
一个带状矩阵 B B B 只在主对角线的上方和下方有 w w w 个非零对角线,带状外的其它元素在消元过程中都保持 0 0 0 不变( L L L 和 U U U 中)。第一列需要 w 2 w^2 w2 次乘法和减法(在主元下方产生 w w w 个 0 0 0,每个 0 0 0 需要使用长度为 w w w 的主元行),所以要执行完消元过程共需要 n w 2 nw^2 nw2 次乘法和减法,得到 U U U。这样会节省很多时间。
带状矩阵 A 到 U 1 3 n 3 减少到 n w 2 求解 n 2 减少到 2 n w \pmb{带状矩阵}\kern 14pt\pmb{A\,到\,U}\kern 8pt\frac{1}{3}n^3减少到nw^2\kern 10pt\pmb{求解}\kern 6ptn^2\,减少到\,2nw 带状矩阵A到U31n3减少到nw2求解n2减少到2nw
一个三对角矩阵( w = 1 w=1 w=1)可以计算的很快,不需要存储 0 0 0。
五、主要内容总结
- 高斯消元法(没有行交换)将 A A A 分解成 L L L 乘 U U U。
- 下三角矩阵 L L L 包含用来乘主元行的乘数 l i j l_{ij} lij,它们使得 A A A 变成 U U U。乘积 L U LU LU 将这些行反向加回去可以恢复成 A A A。
- 在右侧我们求解 L c = b L\boldsymbol c=\boldsymbol b Lc=b(前向),然后求解 U x = c U\boldsymbol x=\boldsymbol c Ux=c(反向)。
- 分解: 左侧共有 n 3 − n 3 \displaystyle\frac{n^3-n}{3} 3n3−n 次乘法和减法(这个结果没有取近似)。
- 求解: 右侧共有 n 2 n^2 n2 次乘法和减法。
- 对于带状矩阵,需要的步骤 1 3 n 3 \displaystyle\frac{1}{3}n^3 31n3 变为 n w 2 nw^2 nw2, n 2 n^2 n2 变为 2 n w 2nw 2nw。
六、例题
【例4】下三角帕斯卡矩阵 L L L 包含著名的 “帕斯卡三角形”,这里我们分解帕斯卡。
对称帕斯卡矩阵 P \pmb P P 是帕斯卡矩阵 L \pmb L L 和 U \pmb U U 的乘积。对称的 P P P 矩阵以帕斯卡三角命名,所以它的每个元素都是其上方和左侧元素之和。MATLAB 中, n × n n\times n n×n 的对称 P P P 矩阵写成 pascal(n)。
问题:建立一个下 - 上三角分解的 P = L U P=LU P=LU。 pascal(4) = [ 1 1 1 1 1 2 3 4 1 3 6 10 1 4 10 20 ] = [ 1 0 0 0 1 1 0 0 1 2 1 0 1 3 3 1 ] [ 1 1 1 1 0 1 2 3 0 0 1 3 0 0 0 1 ] = L U \textrm{pascal(4)}=\begin{bmatrix}\pmb1&\pmb1&\pmb1&\pmb1\\\pmb1&\pmb2&\pmb3&4\\\pmb1&\pmb3&6&10\\\pmb1&4&10&20\\\end{bmatrix}=\begin{bmatrix}\pmb1&0&0&0\\\pmb1&\pmb1&0&0\\\pmb1&\pmb2&\pmb1&0\\\pmb1&\pmb3&\pmb3&\pmb1\end{bmatrix}\begin{bmatrix}\pmb1&\pmb1&\pmb1&\pmb1\\0&\pmb1&\pmb2&\pmb3\\0&0&\pmb1&\pmb3\\0&0&0&\pmb1\end{bmatrix}=LU pascal(4)= 1111123413610141020 = 1111012300130001 1000110012101331 =LU预测并检验 5 × 5 5\times5 5×5 的帕斯卡矩阵的下一行和下一列。
解: 计算 L U LU LU 可以得到 P P P。下面从对称 P P P 矩阵出发,利用消元法得到上三角矩阵 U U U: P = [ 1 1 1 1 1 2 3 4 1 3 6 10 1 4 10 20 ] → [ 1 1 1 1 0 1 2 3 0 2 5 9 0 3 9 19 ] → [ 1 1 1 1 0 1 2 3 0 0 1 3 0 0 3 10 ] → [ 1 1 1 1 0 1 2 3 0 0 1 3 0 0 0 1 ] = U P=\begin{bmatrix}1&1&1&1\\1&2&3&4\\1&3&6&10\\1&4&10&20\end{bmatrix}\rightarrow\begin{bmatrix}1&1&1&1\\0&1&2&3\\0&2&5&9\\0&3&9&19\end{bmatrix}\rightarrow\begin{bmatrix}1&1&1&1\\0&1&2&3\\0&0&1&3\\0&0&3&10\end{bmatrix}\rightarrow\begin{bmatrix}1&1&1&1\\0&1&2&3\\0&0&1&3\\0&0&0&1\end{bmatrix}=U P= 1111123413610141020 → 10001123125913919 → 10001100121313310 → 1000110012101331 =U上面步骤所用到的乘数 l i j l_{ij} lij 会进入到下三角矩阵 L L L, P = L U P=LU P=LU 是一个特别整洁有序的例子。注意到 U U U 的在对角线上的主元都是 1 1 1。
若使用 MATLAB 来计算,指令 lu(pascal(4)) 无法生成上述的 U U U,这是因为 lu 的子程序会在每一列选取最大的主元,这样第二主元就变成了 3 3 3,而不是 1 1 1,但是使用乔里斯基(Cholesky)分解不会发生行交换,可以产生上述结果:U = chol(pascal(4))
【例5】问题:求解 P x = b = ( 1 , 0 , 0 , 0 ) P\boldsymbol x=\boldsymbol b=(1,0,0,0) Px=b=(1,0,0,0)。方程的右侧等于 I I I 的第一列,这表明 x \boldsymbol x x 会是 P − 1 P^{-1} P−1 的第一列。这就是高斯 - 若尔当消元法,会匹配 P P − 1 = I PP^{-1}=I PP−1=I 的列。我们已知帕斯卡矩阵 L L L 和 U U U 是 P P P 的两个因子: 两个三角系统 L c = b ( 前向 ) U x = c ( 后向 ) \pmb{两个三角系统}\kern 20ptL\boldsymbol c=\boldsymbol b\,(前向)\kern 10ptU\boldsymbol x=\boldsymbol c\,(后向) 两个三角系统Lc=b(前向)Ux=c(后向)解: 下三角系统 L c = b L\boldsymbol c=\boldsymbol b Lc=b 由上到下求解 c 1 = 1 c 1 + c 2 = 0 c 1 + 2 c 2 + c 3 = 0 c 1 + 3 c 2 + 3 c 3 + c 4 = 0 解得 c 1 = + 1 c 2 = − 1 c 3 = + 1 c 4 = − 1 \begin{matrix}c_1\kern 74pt=1\\c_1+c_2\kern 53pt=0\\c_1+2c_2+c_3\kern 27pt=0\\c_1+3c_2+3c_3+c_4=0\end{matrix}\kern 10pt解得\kern 10pt\begin{matrix}c_1=+1\\c_2=-1\\c_3=+1\\c_4=-1\end{matrix} c1=1c1+c2=0c1+2c2+c3=0c1+3c2+3c3+c4=0解得c1=+1c2=−1c3=+1c4=−1利用 L − 1 L^{-1} L−1 执行前向消元,得到上三角形系统 U x = c U\boldsymbol x=\boldsymbol c Ux=c,使用回代求解 x \boldsymbol x x,上三角系统由下到上求解: x 1 + x 2 + x 3 + x 4 = 1 x 2 + 2 x 3 + 3 x 4 = − 1 x 3 + 3 x 4 = 1 x 4 = − 1 解得 x 1 = + 4 x 2 = − 6 x 3 = + 4 x 4 = − 1 \begin{matrix}x_1+x_2+x_3+x_4=1\\\kern 22ptx_2+2x_3+3x_4=-1\\\kern 44ptx_3+3x_4=1\\\kern 81ptx_4=-1\end{matrix}\kern 10pt解得\kern 10pt\begin{matrix}x_1=+4\\x_2=-6\\x_3=+4\\x_4=-1\end{matrix} x1+x2+x3+x4=1x2+2x3+3x4=−1x3+3x4=1x4=−1解得x1=+4x2=−6x3=+4x4=−1使用 inv(pascal(4)) 指令求得 P P P 的逆矩阵,可以看到解就是 P − 1 P^{-1} P−1 的第一列。