891 字
4 分钟
柯西交错定理的证明

一、定理陈述#

柯西交错定理: 设 A=[ayyB]A=\begin{bmatrix}a & y^{*} \\ y & B\end{bmatrix}nn 阶 Hermitian 矩阵,BBAAn1n - 1 阶主子矩阵,μ2μ3μn\mu_{2} \leq \mu_{3} \leq \cdots \leq \mu_{n}BB 的特征值,λ1λ2λn\lambda_{1} \leq \lambda_{2} \leq \cdots \leq \lambda_{n}AA 的特征值,则 λnμnλn1μn1λ2μ2λ1\lambda_{n} \leq \mu_{n} \leq \lambda_{n - 1} \leq \mu_{n - 1} \leq \cdots \leq \lambda_{2} \leq \mu_{2} \leq \lambda_{1}

二、证明过程#

(一)特殊情况证明(μn<μn1<<μ3<μ2\mu_{n}<\mu_{n - 1}<\cdots<\mu_{3}<\mu_{2}zi0z_{i} \neq 0i=2,3,,ni = 2,3,\cdots,n#

  1. 酉矩阵的构造
    • 通过同时置换 AA 的行和列(若必要),假设子矩阵 BB 占据 AA 的第 2,3,,n2,3,\cdots,n 行和列,即 A=[ayyB]A=\begin{bmatrix}a & y^{*} \\ y & B\end{bmatrix}
    • 因为 BB 是 Hermitian 矩阵,存在 n1n - 1 阶酉矩阵 UU 使得 UBU=DU^{*} B U = D,其中 D=diag(μ2,μ3,,μn)D=\text{diag}(\mu_{2},\mu_{3},\cdots,\mu_{n})。设 Uy=z=(z2,z3,,zn)TU^{*} y = z=(z_{2},z_{3},\cdots,z_{n})^{T}
    • 构造酉矩阵 V=[10T0U]V=\begin{bmatrix}1 & 0^{T} \\ 0 & U\end{bmatrix},则 VAV=[azzD]V^{*} A V=\begin{bmatrix}a & z^{*} \\ z & D\end{bmatrix}
  2. 行列式变换
    • 首先,对 VAVV^{*} A V 的行列式变换进行说明:
      • 酉矩阵的性质:
        • VV 是酉矩阵,满足 VV=VV=IV^{*}V = VV^{*}=I,其中 VV^{*}VV 的共轭转置,II 是单位矩阵。
      • 相似矩阵的行列式性质:
        • 对于任意方阵 AA 和可逆矩阵 PP,有 det(P1AP)=det(A)\text{det}(P^{-1}AP)=\text{det}(A)
        • 在此处,VV 是酉矩阵,V=V1V^{*}=V^{-1}
        • 所以 VAVV^{*}AVAA 是相似矩阵,根据相似矩阵的行列式性质,det(xIA)=det(xIVAV)\text{det}(xI - A)=\text{det}(xI - V^{*}AV)。具体而言,设 y=xIAy = xI - Az=xIVAVz = xI - V^{*}AV,则 z=V(xIA)V=VyVz = V^{*}(xI - A)V = V^{*}yV
        • 由于 det(VyV)=det(V)det(y)det(V)\text{det}(V^{*}yV)=\text{det}(V^{*})\text{det}(y)\text{det}(V),且 det(V)=det(V)\text{det}(V^{*})=\overline{\text{det}(V)} 以及 det(V)det(V)=1\text{det}(V)\overline{\text{det}(V)} = 1(酉矩阵性质),所以 det(VyV)=det(y)\text{det}(V^{*}yV)=\text{det}(y),即 det(xIA)=det(xIVAV)\text{det}(xI - A)=\text{det}(xI - V^{*}AV)
    • 然后将 det(xIVAV)\text{det}(xI - V^{*} A V) 沿第一行展开得到:
      • f(x)=(xa)(xμ2)(xμn)i=2nfi(x)f(x)=(x - a)(x-\mu_{2}) \cdots(x-\mu_{n})-\sum_{i = 2}^{n} f_{i}(x)
      • 其中 fi(x)=zi2(xμ2)(x^μi)(xμn)f_{i}(x)=\vert z_{i}\vert^{2}(x-\mu_{2}) \cdots(x\widehat{-}\mu_{i}) \cdots(x-\mu_{n})i=2,3,,ni = 2,3,\cdots,n),这里 (x^μi)(x\widehat{-}\mu_{i}) 表示去掉 (xμi)(x - \mu_{i}) 这一项。
  3. fi(x)f_{i}(x) 正负性质的判断
    • 分析 fi(x)f_{i}(x) 的值可知:
      • jij \neq i 时,fi(μj)=0f_{i}(\mu_{j}) = 0
      • ii 为偶数时,fi(μi)>0f_{i}(\mu_{i})>0;当 ii 为奇数时,fi(μi)<0f_{i}(\mu_{i})<0。其原因如下:
        • ii 为奇数时,考虑 fi(μi)=zi2(μiμ2)(μiμi1)(μiμi+1)(μiμn)f_{i}(\mu_{i})=\vert z_{i}\vert^{2}(\mu_{i} - \mu_{2})\cdots(\mu_{i} - \mu_{i - 1})(\mu_{i} - \mu_{i + 1})\cdots(\mu_{i} - \mu_{n}) 这一乘积:
          • 对于这一乘积:
            • ii 为奇数时,μi\mu_{i} 小于它前面的偶数位置的 μj\mu_{j}j<ij < ijj 为偶数),所以 (μiμj)<0(\mu_{i} - \mu_{j})<0j<ij < ijj 为偶数)。
            • 同时,μi\mu_{i} 大于它后面的偶数位置的 μk\mu_{k}k>ik > ikk 为偶数),所以 (μiμk)<0(\mu_{i} - \mu_{k})<0k>ik > ikk 为偶数)。
            • 而对于奇数位置的 μl\mu_{l}lil\neq i),(μiμl)(\mu_{i} - \mu_{l}) 的正负情况交替出现,但总体乘积的符号由偶数位置的 μ\mu 决定。
          • 因为有偶数个 (μiμj)<0(\mu_{i} - \mu_{j})<0jj 为偶数且 jij\neq i),所以 (μiμ2)(μiμi1)(μiμi+1)(μiμn)<0(\mu_{i} - \mu_{2})\cdots(\mu_{i} - \mu_{i - 1})(\mu_{i} - \mu_{i + 1})\cdots(\mu_{i} - \mu_{n})<0
          • 又因为 zi2>0\vert z_{i}\vert^{2}>0,所以 fi(μi)=zi2(μiμ2)(μiμi1)(μiμi+1)(μiμn)<0f_{i}(\mu_{i})=\vert z_{i}\vert^{2}(\mu_{i} - \mu_{2})\cdots(\mu_{i} - \mu_{i - 1})(\mu_{i} - \mu_{i + 1})\cdots(\mu_{i} - \mu_{n})<0
    • 进而得到 f(μi)f(\mu_{i}) 的正负性:
      • ii 为偶数时,f(μi)<0f(\mu_{i})<0;当 ii 为奇数时,f(μi)>0f(\mu_{i})>0i=2,3,,ni = 2,3,\cdots,n)。
  4. 根的讨论
    • 由于 f(x)f(x) 是首项系数为正的 nn 次多项式,根据中间值定理可知方程 f(x)=0f(x)=0 存在 nn 个根 λ1,λ2,,λn\lambda_{1},\lambda_{2},\cdots,\lambda_{n},使得 λn<μn<λn1<μn1<<λ2<μ2<λ1\lambda_{n}<\mu_{n}<\lambda_{n - 1}<\mu_{n - 1}<\cdots<\lambda_{2}<\mu_{2}<\lambda_{1}

(二)一般情况证明#

  1. 构造趋近矩阵
    • ϵ1,ϵ2,\epsilon_{1},\epsilon_{2},\cdots 是一列正实数,满足 ϵk0\epsilon_{k} \downarrow 0zi+ϵk0z_{i}+\epsilon_{k} \neq 0i=2,3,,ni = 2,3,\cdots,nk=1,2,k = 1,2,\cdots)且 D+ϵkdiag(2,3,,n)D+\epsilon_{k}\text{diag}(2,3,\cdots,n) 的对角元对固定的 kk 是不同的。
    • k=1,2,k = 1,2,\cdots,定义 Ck=[az(ϵk)z(ϵk)D(ϵk)]C_{k}=\begin{bmatrix}a & z(\epsilon_{k})^{*} \\ z(\epsilon_{k}) & D(\epsilon_{k})\end{bmatrix},其中 z(ϵk)=z+ϵk(1,1,,1)Tz(\epsilon_{k})=z+\epsilon_{k}(1,1,\cdots,1)^{T}D(ϵk)=D+ϵkdiag(2,3,,n)D(\epsilon_{k})=D+\epsilon_{k}\text{diag}(2,3,\cdots,n),且 Ak=VCkVA_{k}=V C_{k} V^{*},则 AkA_{k} 是 Hermitian 矩阵且 AkAA_{k} \to A
  2. 特征值关系
    • λn(k)λn1(k)λ2(k)λ1(k)\lambda_{n}^{(k)} \leq\lambda_{n - 1}^{(k)} \leq\cdots \leq\lambda_{2}^{(k)} \leq\lambda_{1}^{(k)}AkA_{k} 的特征值,则 λn(k)<μn+nϵk<λn1(k)<μn1+(n1)ϵk<<λ2(k)<μ2+2ϵk<λ1(k)\lambda_{n}^{(k)}<\mu_{n}+n\epsilon_{k}<\lambda_{n - 1}^{(k)}<\mu_{n - 1}+(n - 1)\epsilon_{k}<\cdots<\lambda_{2}^{(k)}<\mu_{2}+2\epsilon_{k}<\lambda_{1}^{(k)}
  3. 极限情况
    • 因为 λn(k),λn1(k),,λ1(k)\lambda_{n}^{(k)},\lambda_{n - 1}^{(k)},\cdots,\lambda_{1}^{(k)}det(xIAk)=0\text{det}(xI - A_{k}) = 0nn 个不同根且 y=det(xIAk)y=\text{det}(xI - A_{k}) 的图像与 y=det(xIA)y=\text{det}(xI - A) 的图像充分接近,所以 (λn(k),λn1(k),,λ1(k))(λn,λn1,,λ1)(\lambda_{n}^{(k)},\lambda_{n - 1}^{(k)},\cdots,\lambda_{1}^{(k)}) \to (\lambda_{n},\lambda_{n - 1},\cdots,\lambda_{1}),证明完成。

通过以上特殊情况和一般情况的证明,柯西交错定理得证。

柯西交错定理的证明
https://kyc001.github.io/posts/柯西交错定理的证明/
作者
kyc001
发布于
2024-12-11
许可协议
CC BY-NC-SA 4.0