← 返回目录
第 9 章:数学杂项
9.1 傅里叶级数
9.2 离散傅里叶变换与 FFT
将序列按奇偶分组:\(f_j^{(e)}=f_{2j}\),\(f_j^{(o)}=f_{2j+1}\),\(j=0,\dots,n/2-1\)。
\[\hat f_k = \hat f_k^{(e)} + \omega_n^k \hat f_k^{(o)}, \quad k=0,\dots,n/2-1\]
\[\hat f_{k+n/2} = \hat f_k^{(e)} - \omega_n^k \hat f_k^{(o)}\]
其中 \(\hat f^{(e)},\hat f^{(o)}\) 是长度 \(n/2\) 的 DFT(利用 \(\omega_n^{k+n/2}=-\omega_n^k\))。
递归分解,复杂度满足 \(T(n)=2T(n/2)+O(n)\),解为 \(T(n)=O(n\log n)\)。
9.3 奇异值分解(SVD)
\(\|A\|_2 = \sigma_1\),\(\|A\|_F = \sqrt{\sum\sigma_i^2}\),\(\kappa_2(A)=\sigma_1/\sigma_r\)。
伪逆:\(A^+ = V\Sigma^+U^T\),其中 \(\Sigma^+=\mathrm{diag}(1/\sigma_1,\dots,1/\sigma_r,0,\dots)\)。
Eckart-Young 定理:秩 \(k\) 的最佳逼近为 \(A_k=\sum_{i=1}^k\sigma_i u_iv_i^T\),满足
\[\min_{\mathrm{rank}(B)\le k}\|A-B\|_2 = \sigma_{k+1}, \quad \min_{\mathrm{rank}(B)\le k}\|A-B\|_F = \sqrt{\sum_{i=k+1}^r\sigma_i^2}\]
\(A^TA\) 是半正定对称矩阵,故有特征分解 \(A^TA = V\Lambda V^T\),特征值 \(\lambda_1\ge\cdots\ge\lambda_n\ge0\),令 \(\sigma_i=\sqrt{\lambda_i}\)。
设 \(r=\mathrm{rank}(A)\),令 \(u_i = Av_i/\sigma_i\)(\(i\le r\)),则 \(\{u_i\}\) 两两正交(\(\langle u_i,u_j\rangle = v_i^TA^TAv_j/(\sigma_i\sigma_j)=\delta_{ij}\)),扩充为 \(\mathbb{R}^m\) 的标准正交基 \(U\)。
验证:\(AV = U\Sigma\),即 \(A=U\Sigma V^T\)。
9.4 矩阵分析补充
上界:\(\|A-A_k\|_2=\|\sum_{i>k}\sigma_i u_iv_i^T\|_2=\sigma_{k+1}\)(奇异值有序)。
下界:设 \(\mathrm{rank}(B)\le k\),则 \(\dim\ker B\ge n-k\)。考虑子空间 \(W=\mathrm{span}\{v_1,\dots,v_{k+1}\}\)(维数 \(k+1\)),由维数公式 \(\ker B\cap W\neq\{0\}\),取单位向量 \(w\in\ker B\cap W\)。
\(\|A-B\|_2\ge\|(A-B)w\|_2=\|Aw\|_2\)(因 \(Bw=0\))。
\(\|Aw\|_2^2=\|U\Sigma V^Tw\|_2^2=\|\Sigma V^Tw\|_2^2\ge\sigma_{k+1}^2\|V^Tw\|_2^2=\sigma_{k+1}^2\)(因 \(w\in W\) 故 \(V^Tw\) 只有前 \(k+1\) 分量非零,且 \(\|w\|=1\))。
令 \(P=AA^+=U\Sigma\Sigma^+U^T\),\(Q=A^+A=V\Sigma^+\Sigma V^T\)。注意 \(\Sigma\Sigma^+=\mathrm{diag}(1,\dots,1,0,\dots)\)(前 \(r\) 个为1),故 \(P,Q\) 均为正交投影矩阵(对称幂等)。
① \(AA^+A=P\cdot A=U\Sigma\Sigma^+U^T\cdot U\Sigma V^T=U\Sigma V^T=A\)。
② \(A^+AA^+=Q\cdot A^+=V\Sigma^+\Sigma V^T\cdot V\Sigma^+U^T=V\Sigma^+U^T=A^+\)。
③ \((AA^+)^T=P^T=P=AA^+\)(\(P\) 对称)。
④ \((A^+A)^T=Q^T=Q=A^+A\)(\(Q\) 对称)。
最小范数最小二乘解:\(x^+=A^+b=V\Sigma^+U^Tb\)。
几何意义:\(x^+\in\mathrm{row}(A)=\ker(A)^\perp\)(在行空间中),\(Ax^+\) 是 \(b\) 在 \(\mathrm{col}(A)\) 上的正交投影 \(AA^+b\)。
正规矩阵可酉对角化:\(A=Q\Lambda Q^*\),\(\Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n)\)。
\(A^TA=Q\bar\Lambda Q^*\cdot Q\Lambda Q^*=Q|\Lambda|^2Q^*\),其中 \(|\Lambda|^2=\mathrm{diag}(|\lambda_i|^2)\)。
故 \(A^TA\) 的特征值为 \(|\lambda_i|^2\),奇异值 \(\sigma_i=\sqrt{|\lambda_i|^2}=|\lambda_i|\)。
9.5 投影与正交分解
充分性(\(P^T=P\Rightarrow\|Px\|\le\|x\|\)):
\(\|x\|^2=\|Px+(I-P)x\|^2=\|Px\|^2+2\langle Px,(I-P)x\rangle+\|(I-P)x\|^2\)。
\(\langle Px,(I-P)x\rangle=x^TP^T(I-P)x=x^TP(I-P)x=x^T(P-P^2)x=0\)(因 \(P^2=P\))。
故 \(\|x\|^2=\|Px\|^2+\|(I-P)x\|^2\ge\|Px\|^2\)。
必要性(\(\|Px\|\le\|x\|\Rightarrow P^T=P\)):
对任意 \(x\),\(\|P(I-P)x\|\le\|(I-P)x\|\),但 \(P(I-P)=P-P^2=0\),故 \(0\le\|(I-P)x\|\)(平凡)。
更直接:\(\|Px\|^2\le\|x\|^2\) 对所有 \(x\) 意味着 \(I-P^TP\succeq0\)。又 \(P^2=P\Rightarrow(P^TP)^2=P^T(PP^T)P\),结合 \(I-P^TP\succeq0\) 可推出 \(P^T=P\)(利用 \(\mathrm{tr}(P^TP)=\mathrm{tr}(P)\) 等)。