← 返回目录

第 4 章:线性方程组数值解

4.1 直接法

简答 LU 分解的存在条件是什么?Cholesky 分解适用于什么矩阵,形式是什么?
LU 分解存在且唯一(单位下三角 \(L\))当且仅当 \(A\) 的所有顺序主子式非零。

Cholesky 分解:\(A\) 对称正定时,存在唯一下三角矩阵 \(L\)(对角元为正)使 \(A = LL^T\)。计算量约为 LU 的一半。
填空 矩阵条件数(2-范数)定义及对称正定矩阵的表达式:
\(\kappa_2(A) =\) ;对称正定时 \(\kappa_2(A) =\)
\(\kappa_2(A) = \|A\|_2\|A^{-1}\|_2 = \dfrac{\sigma_{\max}(A)}{\sigma_{\min}(A)}\)

对称正定时:\(\kappa_2(A) = \dfrac{\lambda_{\max}(A)}{\lambda_{\min}(A)}\)
填空 线性方程组 \(Ax=b\) 的扰动分析:设 \(A\) 非奇异且不变,若右端项有扰动 \(A(x+\delta x)=b+\delta b\),则
\(\dfrac{\|\delta x\|}{\|x\|} \le\)
\[\frac{\|\delta x\|}{\|x\|} \le \kappa(A)\frac{\|\delta b\|}{\|b\|}\] 类似地,若 \(A\) 有扰动 \(\delta A\):\(\dfrac{\|\delta x\|}{\|x+\delta x\|} \le \kappa(A)\dfrac{\|\delta A\|}{\|A\|}\)

4.2 经典迭代法

填空 将 \(A = D - L - U\)(\(D\) 对角,\(L,U\) 严格下/上三角),写出 Jacobi 和 Gauss-Seidel 的迭代矩阵:
Jacobi:\(B_J =\)

Gauss-Seidel:\(B_{GS} =\)
\(B_J = D^{-1}(L+U)\)
\(B_{GS} = (D-L)^{-1}U\)
证明 迭代法 \(x^{(k+1)}=Bx^{(k)}+c\) 收敛(对任意初值)当且仅当谱半径 \(\rho(B) < 1\)。
设精确解 \(x^*=Bx^*+c\),误差 \(e^{(k)}=x^{(k)}-x^*\) 满足 \(e^{(k)}=B^k e^{(0)}\)。

充分性:\(\rho(B)<1\) 时,\(\forall\varepsilon>0\) 存在范数使 \(\|B\|\le\rho(B)+\varepsilon<1\),故 \(\|e^{(k)}\|\le\|B\|^k\|e^{(0)}\|\to0\)。

必要性:若 \(\rho(B)\ge1\),设 \(\lambda\) 为对应特征值,\(Bv=\lambda v\),取 \(e^{(0)}=v\),则 \(e^{(k)}=\lambda^k v\),\(\|e^{(k)}\|\not\to0\)。
填空 SOR 方法的迭代格式(\(\omega\) 为松弛因子):
\(x_i^{(k+1)} =\)
\(x_i^{(k+1)} = (1-\omega)x_i^{(k)} + \dfrac{\omega}{a_{ii}}\!\left(b_i - \sum_{j<i}a_{ij}x_j^{(k+1)} - \sum_{j>i}a_{ij}x_j^{(k)}\right)\)

迭代矩阵:\(B_\omega = (D-\omega L)^{-1}[(1-\omega)D+\omega U]\);收敛必要条件:\(0<\omega<2\)。

4.3 Krylov 子空间方法

填空 CG 方法(\(A\) 对称正定,\(r_k=b-Ax_k\),\(p_k\) 为搜索方向)的递推公式:
\(\alpha_k =\) ,  \(x_{k+1} =\)

\(\beta_k =\) ,  \(p_{k+1} =\)
\(\alpha_k = \dfrac{r_k^Tr_k}{p_k^TAp_k}\), \(x_{k+1}=x_k+\alpha_k p_k\), \(r_{k+1}=r_k-\alpha_k Ap_k\)

\(\beta_k = \dfrac{r_{k+1}^Tr_{k+1}}{r_k^Tr_k}\), \(p_{k+1}=r_{k+1}+\beta_k p_k\)
证明 用归纳法证明 CG 方法的残差正交性 \(r_i^Tr_j=0\)(\(i\neq j\))和搜索方向共轭性 \(p_i^TAp_j=0\)(\(i\neq j\))。
用归纳法,设到第 \(k\) 步时 \(r_i^Tr_j=0\)(\(i\neq j\le k\))和 \(p_i^TAp_j=0\)(\(i\neq j\le k\))均成立。

残差正交性:由递推 \(r_{k+1}=r_k-\alpha_k Ap_k\),对 \(j\le k\):
\(r_{k+1}^Tr_j = r_k^Tr_j - \alpha_k p_k^TAr_j\)。
当 \(j<k\) 时:\(r_k^Tr_j=0\)(归纳假设);\(p_k^TAr_j\):由 \(r_j=p_j-\beta_{j-1}p_{j-1}\) 及共轭性,\(p_k^TAp_j=0\),\(p_k^TAp_{j-1}=0\),故 \(p_k^TAr_j=0\)。
当 \(j=k\) 时:\(r_k^Tr_k=\|r_k\|^2\),\(\alpha_k=\frac{r_k^Tr_k}{p_k^TAp_k}\),故 \(r_{k+1}^Tr_k=\|r_k\|^2-\frac{\|r_k\|^2}{p_k^TAp_k}\cdot p_k^TAp_k=0\)。

共轭性:由递推 \(p_{k+1}=r_{k+1}+\beta_k p_k\),对 \(j\le k\):
\(p_{k+1}^TAp_j = r_{k+1}^TAp_j + \beta_k p_k^TAp_j\)。
当 \(j<k\):两项均为零(归纳假设 + 残差正交性推出 \(r_{k+1}^TAp_j=0\))。
当 \(j=k\):\(\beta_k=\frac{r_{k+1}^Tr_{k+1}}{r_k^Tr_k}\),\(r_{k+1}^TAp_k=\frac{1}{\alpha_k}r_{k+1}^T(r_k-r_{k+1})=-\frac{\|r_{k+1}\|^2}{\alpha_k}\),\(\beta_k p_k^TAp_k=\frac{\|r_{k+1}\|^2}{\|r_k\|^2}\cdot\frac{\|r_k\|^2}{\alpha_k}=\frac{\|r_{k+1}\|^2}{\alpha_k}\),两项相消为零。
填空 \(k\) 阶 Krylov 子空间的定义:
\(\mathcal{K}_k(A, r_0) =\)
\[\mathcal{K}_k(A,r_0) = \mathrm{span}\{r_0, Ar_0, A^2r_0, \dots, A^{k-1}r_0\}\]
证明 CG 方法的误差估计:设 \(A\) 对称正定,\(\kappa=\kappa_2(A)\),则 \[\|x_k - x^*\|_A \le 2\left(\frac{\sqrt\kappa-1}{\sqrt\kappa+1}\right)^k\|x_0-x^*\|_A\]
CG 的第 \(k\) 步解满足:\(x_k = \arg\min_{x\in x_0+\mathcal{K}_k}\|x-x^*\|_A\),等价地,\(\|e_k\|_A = \min_{p\in\mathcal{P}_k,\,p(0)=1}\|p(A)e_0\|_A\)。

由 \(A\) 的特征值 \(\lambda_i\in[\lambda_{\min},\lambda_{\max}]\): \[\|e_k\|_A^2 = \sum_i p(\lambda_i)^2\langle e_0,v_i\rangle_A^2 \le \max_{\lambda\in[\lambda_{\min},\lambda_{\max}]}p(\lambda)^2\cdot\|e_0\|_A^2\] 取 \(p(\lambda) = T_k\!\left(\frac{\lambda_{\max}+\lambda_{\min}-2\lambda}{\lambda_{\max}-\lambda_{\min}}\right)/T_k\!\left(\frac{\lambda_{\max}+\lambda_{\min}}{\lambda_{\max}-\lambda_{\min}}\right)\)(平移缩放的 Chebyshev 多项式),利用 \(T_k\) 的最优性和 \(|T_k(x)|\ge1\) 对 \(|x|>1\) 的下界,得 \[\min_{p(0)=1}\max_{\lambda\in[\lambda_{\min},\lambda_{\max}]}|p(\lambda)| = \frac{1}{T_k\!\left(\frac{\kappa+1}{\kappa-1}\right)} \le 2\left(\frac{\sqrt\kappa-1}{\sqrt\kappa+1}\right)^k\] 最后一步用 \(T_k(x)\ge\frac{1}{2}((x+\sqrt{x^2-1})^k+(x-\sqrt{x^2-1})^k)\ge(x+\sqrt{x^2-1})^k/2\)(\(x>1\))。
简答 简述 GMRES 方法的基本思想,与 CG 的主要区别是什么?
GMRES(广义最小残差法):在 \(x_0+\mathcal{K}_k(A,r_0)\) 中求使残差 \(\|b-Ax_k\|_2\) 最小的解。用 Arnoldi 过程构造 \(\mathcal{K}_k\) 的正交基,将问题化为最小二乘问题(用 Givens 旋转求解)。

与 CG 的区别:① GMRES 适用于一般非对称矩阵;② CG 最小化 \(A\)-范数误差(需 \(A\) 对称正定);③ GMRES 每步需存储所有 Krylov 向量(内存开销大),实用中用重启版本 GMRES(\(m\))。

4.4 综合练习

证明 设 \(A\) 对称正定,证明 SOR 方法收敛当且仅当 \(0 < \omega < 2\)。
SOR 迭代矩阵 \(B_\omega=(D-\omega L)^{-1}[(1-\omega)D+\omega U]\)。

必要性(\(\rho(B_\omega)<1\Rightarrow 0<\omega<2\)):
\(\det(B_\omega)=\prod_i\lambda_i\),另一方面 \(\det(B_\omega)=\det((1-\omega)D+\omega U)/\det(D-\omega L)=(1-\omega)^n\)(上/下三角行列式只看对角元)。若 \(\rho(B_\omega)<1\),则 \(|\det B_\omega|=|1-\omega|^n<1\),故 \(|1-\omega|<1\),即 \(0<\omega<2\)。

充分性(\(0<\omega<2\Rightarrow\rho(B_\omega)<1\)):
设 \(B_\omega v=\lambda v\),\(v\neq0\),即 \([(1-\omega)D+\omega U]v=\lambda(D-\omega L)v\)。
两边左乘 \(v^*\)(共轭转置),令 \(\alpha=v^*Dv>0\)(\(D\) 正定),\(\beta=v^*Lv\),则 \(v^*Uv=\bar\beta\)(因 \(A=D-L-U\) 对称,\(U=L^T\))。
得 \((1-\omega)\alpha+\omega\bar\beta=\lambda(\alpha-\omega\beta)\),故
\(|\lambda|=\left|\frac{(1-\omega)\alpha+\omega\bar\beta}{\alpha-\omega\beta}\right|\)。
令 \(\beta=p+qi\),则分子模平方 \(=[(1-\omega)\alpha+\omega p]^2+\omega^2q^2\),分母模平方 \(=(\alpha-\omega p)^2+\omega^2q^2\)。
\(|\lambda|^2<1\) 等价于 \([(1-\omega)\alpha+\omega p]^2<(\alpha-\omega p)^2\),展开化简得 \(\omega(2-\omega)\alpha^2>0\),当 \(0<\omega<2\) 时成立(\(\alpha>0\))。
简答 对严格对角占优矩阵,Jacobi 和 Gauss-Seidel 方法是否一定收敛?给出理由。
是的,两者均收敛。

严格对角占优:\(|a_{ii}|>\sum_{j\neq i}|a_{ij}|\)。

Jacobi:\(\|B_J\|_\infty = \max_i\sum_{j\neq i}\frac{|a_{ij}|}{|a_{ii}|}<1\),故 \(\rho(B_J)\le\|B_J\|_\infty<1\),收敛。

Gauss-Seidel:可用类似估计或利用"严格对角占优 \(\Rightarrow\) GS 收敛"定理(证明略复杂,需对 \(B_{GS}\) 的特征值做更细致分析)。
证明 Sherman-Morrison 公式:若 \(A\) 可逆且 \(1+v^TA^{-1}u\neq0\),则 \[(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}\]
直接验证:令 \(B=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}\),计算 \((A+uv^T)B\):
\(=I + uv^TA^{-1} - \frac{A^{-1}uv^TA^{-1}+uv^TA^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}\cdot A\)(注意 \(v^TA^{-1}u\) 是标量)
\(=I + uv^TA^{-1} - \frac{(1+v^TA^{-1}u)uv^TA^{-1}}{1+v^TA^{-1}u} = I+uv^TA^{-1}-uv^TA^{-1}=I\)。