Skip to content

Higher Algebra: 矩阵

相关信息

相关阅读资料:

矩阵的性质

矩阵的逆:设\(A\)为n阶方阵,若存在n阶方阵\(B\),使得\(AB=BA=I_n\),则称\(A\)可逆,\(B\)\(A\)的逆矩阵,记为\(A^{-1}\)

若矩阵没有逆,则称矩阵为奇异阵,反之则称矩阵为非异阵或可逆阵。可逆矩阵经初等变换后仍是可逆矩阵,奇异阵经初等变换后仍是奇异阵。

\(A\)是一个n阶可逆矩阵,则通过有限次的初等变换\(P_m...P_1 A\)就可以转化为单位矩阵\(I_n\)。(\(A = P_1^{-1}...P_m^{-1}\)

矩阵的相抵:若一矩阵\(A\)经过有限次初等变换后变成\(B\),则称\(A\)\(B\)是等价的,或\(A\)\(B\)相抵,记为\(A\sim B\).

对于任一矩阵\(A_{m \times n} = (a_{ij})_{m \times n}\)必相抵于下列\(m \times n\)矩阵:

\[ B = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} \]

\(A \sim B\),任一\(m \times n\)矩阵均与一个主对角线上元素等于1或0而而其余元素均为0的\(m \times n\)矩阵相抵。

易得:对任意一个秩为\(r\)\(m \times n\)矩阵\(A\),总存在\(m\)阶可逆阵\(P\)\(n\)阶可逆阵\(Q\),使得:

\[ PAQ = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} \]

关于矩阵的秩

  • 任意矩阵\(A\)的转置\(A^T\)\(A\)具有相同的秩,即\(rank(A) = rank(A^T)\)

  • 任意矩阵与可逆阵相乘,其秩不变

  • \(n\)阶方阵\(A\)为可逆阵的充分必要条件为\(A\)为满秩阵\(rank(A) = n\)

  • 两个\(m \times n\)矩阵等价的充分必要条件为它们具有相同的秩,即\(rank(A_{m \times n}) = rank(B_{m \times n})\)

  • 对于给\(A_{m \times n}\)\(B_{n \times s}\),有\(\(r(A) + r(B) -n \leq rank(AB) \leq min \{ r(A), r(B) \}\)\) 证明Sylvester不等式:\(\(\begin{pmatrix} I_n & 0 \\ 0 & AB \end{pmatrix} \sim \begin{pmatrix} I_n & 0 \\ A & AB \end{pmatrix} \sim \begin{pmatrix} I_n & A \\ -B & 0 \end{pmatrix} \sim \begin{pmatrix} -B & I_n \\ 0 & A \end{pmatrix}\)\) 因此\(r(A) + r(B) -n \leq rank(AB)\)显然成立。

矩阵分块

设矩阵\(A_{s \times} n\)\(B_{n \times m}\)\(C_{s \times m}\),则\(B\)的列向量组为\(\beta_1,\beta_2,...,\beta_m\),则\(AB=A(\beta_1,\beta_2,...,\beta_m)=(A\beta_1,A\beta_2,...,A\beta_m)\)\(C\)的列向量组\(\delta_1,\delta_2,...,\delta_m\)

对于\(AB=C\)可以看作\((A\beta_1,A\beta_2,...,A\beta_m)=(\delta_1,\delta_2,...,\delta_m) \ \rightarrow \ A \beta_j = \delta_j \ (j=1,2,...,m)\),即\(\beta_j\)\(Ax=\delta_j\)的一个解。

$Exercise. $ 证明:设\(A_{s \times n},B_{n \times m}\),若\(AB=0\),证明:\(rank(A)+rank(B) \leq n\)

\(B\)的列向量组为\(\beta_1,\beta_2,...,\beta_m\)。显然\(\beta_j\)属于\(Ax=0\)的解空间\(W\),则\(rank(B) = dim<\beta_1,\beta_2,...,\beta_m> \leq dim \ W = n - rank(A)\)。即为\(rank(A)+rank(B) \leq n\)

n维向量空间


$Def.1 $ 定义数域\(K\)上所有\(n\)元有序数组组成的几何\(K^n = \{ (a_1,a_2,...,a_n) | a_i \in K, \ i=1,2,...,n \}\),连同定义在其上面的加法运算和数乘运算,及其满足的运算法则,称为数域\(K\)上的一个\(n\)维向量空间。

$Def.2 $ 若\(K^n\)的一个非空子集\(U\)满足:(1)\(\mathbf{\alpha,\gamma} \in U \ \rightarrow \ \mathbf{\alpha + \gamma} \in U\) ;(2)\(\mathbf{\alpha} \in U, \ k \in K \ \rightarrow \ k\mathbf{\alpha} \in U\),则称\(U\)\(K^n\)的一个线性子空间(加法封闭、数乘封闭)。

\(Exercise. \ \(假设\)\mathbf{a_1,...,a_s}\)线性无关,有:

\[ \begin{aligned} \mathbf{b_1} =& a_{11} \mathbf{a_1} + ... + a_{1s} \mathbf{a_s} \\ ...& \\ \mathbf{b_s} =& a_{s1} \mathbf{a_1} + ... + a_{1s} \mathbf{a_s} \\ \end{aligned} \]

证明:\(\mathbf{b_1},...,\mathbf{b_s}\)线性无关的充分必要条件是:\(\(\begin{vmatrix} a_{11} & ... & a_{s1} \\ ... & & ... \\ a_{1s} & ... & a_{ss} \end{vmatrix} \neq 0\)\)

\(k_1 \mathbf{b_1} + ... + k_s \mathbf{b_s} = 0\),即为\((k_1 a_{11}+...+k_s a_{s1}) \mathbf{a_1} + ...+ (k_1 a_{1s}+...+k_s a_{ss}) \mathbf{a_s} = 0\)。已知\(\mathbf{a_1,...,a_s}\)线性无关:

\[ \begin{cases} k_1 a_{11}+...+k_s a_{s1} =0\\ ... \\ k_1 a_{1s}+...+k_s a_{ss} =0\\ \end{cases} \ \rightarrow \ |A| = \begin{vmatrix} a_{11} & ... & a_{s1} \\ ... & & ... \\ a_{1s} & ... & a_{ss} \end{vmatrix} \]

\(|A| \neq 0\),则以上齐次线性方程只有零解,\(k_1=0,...k_s=0\)\(\mathbf{b_1},...,\mathbf{b_s}\)线性无关

$Def.3 $向量组的极大线性无关组所含的向量个数称为这个向量组的秩。

若向量组\(\mathbf{a_1,...,a_s}\)可以由向量组\(\mathbf{b_1,...,b_s}\)线性表出,则\(rank(\mathbf{a_1,...,a_s}) \leq rank(\mathbf{b_1,...,b_s})\)。等价的向量组有相同的秩,但秩相同的向量组不一定等价(除非满秩)。因此,两个向量组等价的充分必要条件是:秩相同且其中一个向量组能由另一个向量组线性标出。

\(Def.4 \ \(设\)U\)\(K^n\)的一个子空间,若线性无关的向量组\(\mathbf{a_1,...,a_s} \in U\),且\(U\)的每个向量都可由\(\mathbf{a_1,...,a_s}\)线性表出,则称\(\mathbf{a_1,...,a_s}\)\(U\)的一个基。基所含的向量个数为\(U\)的维数,记作\(dim_K(U) = s\)。(显然\(dimK^N = n\)

\(U\)\(W\)均为\(K^n\)的非零子空间,且\(U \subseteq W \(,那么\)U\)的基\(\mathbf{a_1,...,a_r}\)可由\(W\)的基\(\mathbf{\eta_1,...,\eta_t}\)线性表出,\(r \leq t\),因此\(dim \ U \leq dim \ W\)

$Def.5 $ 数域\(K\)上n元齐次线性方程组\(AX=0\)的解空间\(W\)的维数\(dim \ W = n - rank(A)\)

证明;因为\(rank(A) = r\),则\(AX=0\)可写成如下:

\[ \begin{cases} x_1= -b_{1,r+1} x_{r+1} - ... - b_{1,n} x_n \\ x_2= -b_{2,r+1} x_{r+1} - ... - b_{2,n} x_n \\ ... \\ x_r = -b_{r,r+1} x_{r+1} - ... - b_{r,n} x_n \\ x_{r+1} = 1 x_{r+1} + ... + 0 x_n \\ ... \\ x_n = 0 x_{r+1} + ... + 1 x_n\\ \end{cases} \]

可得线性无关的n-r个解\(\mathbf{\eta_1,...,\eta_{n-r}}\),即:

\[ \mathbf{\eta_1} = \begin{pmatrix} -b_{1,r+1} \\ ... \\ -b_{r,r+1} \\ 1 \\ 0 \\ ... \\ 0 \end{pmatrix},...,\mathbf{\eta_{n-r}} = \begin{pmatrix} -b_{1,r+1} \\ ... \\ -b_{r,r+1} \\ 0 \\ 0 \\ ... \\ 1 \end{pmatrix} \]

取其中一个解\(\mathbf{\eta} = (c_1,...,c_n)^T\),则:

$$ \begin{aligned}

\mathbf{\eta} =& \begin{pmatrix} c_1 \ ... \ c_r \ c_{r+1} \ ... \ c_n \end{pmatrix} = \begin{pmatrix} -b_{1,r+1} c_{r+1}& -& ...& -& b_{1,n} c_{n}& \ ... \ -b_{r,r+1} c_{r+1}& -& ...& -& b_{r,n} c_{n}& \ 1 c_{r+1}& +& ...& -& 0 c_{n}& \ ... \ 0 c_{r+1}& +& ...& -& 1 c_{n}& \ \end{pmatrix} \

=& c_{r+1} \mathbf{\eta}1 +...+ c \end{aligned} $$} \mathbf{\eta}_{n-r

显然每一个解都可由\(\mathbf{\eta_1,...,\eta_{n-r}}\)线性表出(基础解系),所以\(\mathbf{\eta_1,...,\eta_{n-r}}\)\(W\)的一个基,\(dim \ W = n-rank(A)\)

$Exercise. $ 设\(A\)是数域\(K\)\(s \times n\)矩阵,证明:若对于\(K^n\)中任意一列向量\(\mathbf{\eta}\),都有\(A \mathbf{\eta}=0\),则\(A = 0\)

\(K^n\)中任意一列向量\(\mathbf{\eta}\)都是\(AX=0\)的解。解空间\(W=K^n\),可知\(dim \ W = n - rank(A) = n\),所以\(rank(A) = 0\)\(A=0\)

正交矩阵

\(Def.1 \ \(实数域上的n阶矩阵\)A\)满足\(A^T A =I_n\),则\(A\)为正交矩阵。若\(A\)可逆,则\(A^{-1} = A^T,AA^{-1}=I_n\)

  • 正交矩阵\(A\)\(A^T(A^{-1}\)也是正交矩阵

  • 正交矩阵的行列式\(|A| = \pm 1\),因为\(det(A^T A) = det(I_n) = 1\),所以\(det(A)^2 = 1\)\(det(A) = \pm 1\)

  • \(A\)\(B\)为正交矩阵,那么\(AB\)也是正交矩阵,因为\((AB)^T AB = A^T B^T AB = A^T I_n B = I_n\)

  • 对于实数域上的n阶矩阵\(A\)的行向量组\(\mathbf{\gamma_1,...,\gamma_n}\),行列向量组\(\mathbf{a_1,...,a_n}\)。满足:$$\gamma_i \gamma_j^T = \delta^j_i, a_i a_j^T = \delta^j_i, 1 \leq i,j \leq n $$

$Def. 2 $ 在\(R^n\)中任取\(\mathbf{a},\mathbf{b} \in R^n\),规定:\((\mathbf{a}, \mathbf{b})=\mathbf{a} \cdot \mathbf{b} = \mathbf{a}^T \mathbf{b} = \sum_{i=1}^n a_i b_i\)。则称\((\mathbf{a}, \mathbf{b})\)\(R^n\)的一个标准内积(内积)。在n维向量空间\(R^n\)有了标准内积后,则\(R^n\)成为欧几里得空间。

若非零向量组中的向量两两正交,则称为正交向量组,且该向量组一定线性无关。若在欧几里得空间\(R^n\)中,n个向量组成的正交向量组一定是\(R^n\)的基(正交基)。n个单位向量组成的正交向量组为\(R^n\)的标准正交基。

$Def. 3 $ 施密特正交化:假设\(\mathbf{a_1,a_2,...,a_s}\)为欧几里得空间\(R^n\)中的一个线性无关向量组,则:

\[ \begin{cases} \mathbf{\beta_1} = \mathbf{\alpha_1} \\ \mathbf{\beta_2} = \mathbf{\alpha_2} - \frac{(\mathbf{\alpha_2} ,\mathbf{\beta_1})}{(\mathbf{\beta_1},\mathbf{\beta_1})} \mathbf{\beta_1} \\ ...\\ \mathbf{\beta_s} = \mathbf{\alpha_s} - \sum_{j=1}^{s-1} \frac{(\mathbf{\alpha_s} ,\mathbf{\beta_j})}{(\mathbf{\beta_j},\mathbf{\beta_j})} \mathbf{\beta_j} \\ \end{cases} \]

通过施密特正交化方法,将线性无关向量组\((\mathbf{a_1,...,a_s})\)正交化,得到正交向量组\((\mathbf{\beta_1,...,\beta_s})\)

\(Exercise. \ \(设\)A\)是实数域上的n阶可逆矩阵,则\(A\)可以唯一分解为正交矩阵\(T\)与主对角元都为正数的上三角矩阵\(B\)之积:\(A = TB\)

证明:设可逆阵\(A\)的行向量组为\(\mathbf{a_1,...,a_n}\),则\(\mathbf{a_1,...,a_n}\)线性无关,且\(\mathbf{a_1,...,a_n}\)\(R^n\)的标准正交基。设\(\mathbf{a_1,...,a_n}\)对应的正交向量组为\(\mathbf{\beta_1,...,\beta_n}\),根据施密特正交化,设\(b_{ji} = \frac{(\mathbf{a_j},\mathbf{\beta_i})}{(\mathbf{\beta_i},\mathbf{\beta_i})}, \ i=2,3,...,n; \ j=1,2,...,i-1\),则:

\[ \begin{aligned} A &= (\mathbf{a_1,...,a_n}) = (\mathbf{\beta_1},\mathbf{\beta_2},...,\mathbf{\beta_n}) \begin{pmatrix} 1 & b_{12} & b_{13} & ... & b_{1n} \\ 0 & 1 & b_{23} & ... & b_{2n} \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & 1 \end{pmatrix} \\ &= (\mathbf{\eta_1},\mathbf{\eta_2},...,\mathbf{\eta_n}) \begin{pmatrix} |\beta_1| & 0 & ... & 0 \\ 0 & |\beta_2| & ... & 0 \\ ... \\ 0 & 0 & ... & |\beta_n| \end{pmatrix} \begin{pmatrix} 1 & b_{12} & b_{13} & ... & b_{1n} \\ 0 & 1 & b_{23} & ... & b_{2n} \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & 1 \end{pmatrix} \\ &= (\mathbf{\eta_1},\mathbf{\eta_2},...,\mathbf{\eta_n}) \begin{pmatrix} |\beta_1| & b_{12}|\beta_1| & b_{13}|\beta_1| & ... & b_{1n}|\beta_1| \\ 0 & |\beta_2| & b_{23}|\beta_2| & ... & b_{2n}|\beta_2| \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & |\beta_n| \end{pmatrix} \\ &= TB \\ \end{aligned} \]

唯一性:\(TB = T_1 B_1 \ \rightarrow \ T_1^{-1} T = B_1 B^{-1}\)。显然\(T_1^{-1}T\)即为正交矩阵,也是上三角矩阵,易得其\(a^2_{kk}=1, \ k=1,2,...,n\),即为单位矩阵,所以\(B_1 B^{-1} = I_n\)\(B_1 = B,T_1 =T\)

上述即为方阵的QR分解,我们可以将其推广到非方阵,设\(A\)是实数域上的\(m \times n\)矩阵(\(m>n\)),则\(A\)可以唯一分解为列向量为正交单位向量组的\(Q_{m \times n}\)与主对角元均为正数的\(n\)阶上三角矩阵\(R\)之积:\(A = QR\)

\[ A = (\mathbf{\eta_1},\mathbf{\eta_2},...,\mathbf{\eta_n}) \begin{pmatrix} |\beta_1| & b_{12}|\beta_1| & b_{13}|\beta_1| & ... & b_{1n}|\beta_1| \\ 0 & |\beta_2| & b_{23}|\beta_2| & ... & b_{2n}|\beta_2| \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & |\beta_n| \end{pmatrix} \]

$Def. 4 $ 假设\(U\)为欧几里得空间\(R^n\)的一个子空间,若向量\(\alpha\)\(U\)中每一个向量正交,即\(\alpha \perp U\)。令\(U^\perp = \{ \mathbf{\alpha} \in R^n | \mathbf{\alpha} \perp U \}\),则\(U^\perp\)\(R^n\)的一个子空间,称为\(U\)正交补

$Def. 5 $ 设\(U\)为欧几里得空间\(R^n\)的一个子空间,令

\[ P_U : R^n \rightarrow R^n, \ \mathbf{a} \rightarrow \mathbf{a_1} \]

其中\(\mathbf{a_1} \in U\),且\(\mathbf{a} - \mathbf{a_1} \in U^{\perp}\),则称\(P_U\)\(U\)正交投影\(\mathbf{a_1}\)称为向量\(\mathbf{a}\)\(U\)上的正交投影。对于\(\mathbf{a} \in R^n\),有

\[ |\mathbf{a} - \mathbf{a_1}| \leq |\mathbf{a} - \mathbf{\gamma}|, \ \forall \mathbf{\gamma} \in U \]

$Exercise.1 $ 设\(A\)是实数域上的\(m \times n\)矩阵(\(m>n\)),\(\beta \in R^n\)。若有\(x_0 \in R^n\)使得\(|Ax_0 - \beta|^2 \leq |Ax - \beta|, \ \forall x \in R^n\),则\(x_0\)为线性方程\(Ax=\beta\)最小二乘解,证明:\(x_0\)是线性方程\(Ax=\beta\)的最小二乘解当且仅当\(x_0\)\(A^T Ax =A^T \beta\)的解

\(U=<a_1,a_2,...,a_n>\)表示\(A\)的列空间,则

\[ |Ax_0 - \beta| \leq |Ax - \beta| \rightarrow |Ax_0 - \beta| \leq |\gamma - \beta| , \ \forall \gamma \in U \]

\(Ax_0\)\(\beta\)在子空间\(U\)上的正交投影,所以\(a_i^T (Ax_0 - \beta) = 0, \ i=1,2,...,n\)。易得\(A^T(Ax_0 - \beta) = \mathbf{0} \ \rightarrow \ A^T A x_0 = A^T \beta\),即\(x_0\)\(A^T Ax =A^T \beta\)的解

$Exercise.2 $ 设\(A\)是实数域上的列满秩\(m \times n\)矩阵(\(m>n\)),其列空间记作\(U = <a_1,a_2,...,a_n> \subset R^m\)。证明\(P_A=A(A^TA)^{-1}A^T\)\(R^m\)\(U\)上的正交投影

任取\(X \in R^m\),由于\(((A^TA)^{-1}A^T) X\)\(n \times 1\)矩阵,可设为\((c_1,c_2,...,c_n)^T\),则:

\[ P_A X = (\mathbf{a_1,a_2,...,a_n}) \begin{pmatrix} c_1\\ c_2 \\ ... \\c_n \end{pmatrix} = c_1\mathbf{a_1} + c_2\mathbf{a_2} + ... + c_n\mathbf{a_n} \in U \]

再证\(X - P_A X = (I_n - P_A)X \in U^{\perp} \subseteq R^m\),即

\[ \begin{pmatrix} \mathbf{a_1}\\ \mathbf{a_2} \\ ... \\ \mathbf{a_n} \end{pmatrix}(I_n - P_A)X = [A^T - A^TA(A^TA)^{-1}A^T]X = \mathbf{0} \]

因此\((I_n - P_A)X \in U^{\perp}\),综上\(P_A=A(A^TA)^{-1}A^T\)\(R^m\)\(U\)上的正交投影。

$Def. 5 $ 若存在一个对应法则\(f\),使得集合\(S\)中的每一个元素\(a\),都有\(S'\)中唯一确定的元素\(b\)与之对应,则称\(f\)\(S\)\(S'\)映射,记作\(f: S \rightarrow S'\)\(a \rightarrow b\)\(b\)称为\(a\)\(f\)下的象,\(a\)称为\(b\)\(f\)下的一个原象。

映射\(f\)可记作:

\[ f(a) = b, \ a \in S \]

\(S\)为映射\(f\)的定义域,\(S'\)为映射\(f\)的陪域,\(S\)的所有元素在\(f\)下的象组成的集合为\(f\)的值域或\(f\)的象,即\(f(S)\)\(Im f\)

\[ f(S) = \{ f(a) \ | \ a \in S \} = \{ b \in S' \ | \ \exist a \in S,f(a)=b \} \]

显然\(f\)的值域是\(f\)的陪域的子集。

  • \(f(S) = S'\),则\(f\)为满射,\(f\)的陪域中的每个元素至少有一个原象

  • 若对于\(a_1,a_2 \in S\),有\(f(a_1)=f(a_2) \ \rightarrow \ a_1=a_2\),则\(f\)为单射,\(f\)的定义域中的不同元素的象不同

  • \(f\)既是单射又是满射,则\(f\)为双射,\(f\)\(S\)\(S'\)一一对应

  • 集合\(S\)到数集的一个映射,称为\(S\)上的一个函数

  • 陪域\(S'\)中的元素\(b\)在映射\(f\)下的所有原象组成的集合称为\(b\)\(f\)下的原象集,记作\(f^{-1}(b)\)

$Def. 6 $ 映射\(g:S \rightarrow S'\)\(f:S' \rightarrow S''\)得到\(S \rightarrow S''\)的一个映射\(fg\),称为\(f\)\(g\)乘积/合成

\[ (fg)(a) = f(g(a)), \ \forall a \in S \]

$Def. 7 $ 设\(f:S \rightarrow S'\),存在一个\(g:S’ \rightarrow S\),使得$$ fg = 1_{S} \quad gf=1_{S'}\(\(,则称映射\)f\)是可逆的,\(g\)\(f\)的一个唯一逆映射,可记作\(f^{-1}\)

映射\(f:S \rightarrow S'\)可逆的充分必要条件为\(f\)是双射

$Def. 8 $ 数域\(K\)上的向量空间\(K^n \rightarrow K^s\)的一个映射\(\sigma\)若保持加法和数乘运算,即\(\forall \mathbf{a,b} \in K^n, \ k \in K\):

\[ \sigma(\mathbf{a+b}) = \sigma(\mathbf{a}) + \sigma(\mathbf{b}), \ \sigma(k\mathbf{a}) = k\sigma(\mathbf{a}) \]

\(\sigma\)\(K^n\)\(K^s\)的一个线性映射。显然矩阵\(A\)是一个线性映射。

假设数域\(K\)上n元线性方程组\(Ax=\beta\)有解,即存在\(\gamma \in K^n\)使得\(A \gamma = \beta\)。根据线性映射的概念,\(\beta \in Im \ A\)

显然\(\beta \in <\mathbf{a_1,a_2,...,a_n}>\),因此\(Im \ A = <\mathbf{a_1,a_2,...,a_n}>\),即线性映射\(A\)的象等于\(A\)的列空间,因此\(Im \ A\)\(K^s\)的一个子空间。

$Def. 9 $ 设\(sigma\)\(K^n \rightarrow K^s\)的一个映射,\(K^n\)的一个子集\(\(\{ \alpha \in K^n \ | \ \sigma(\alpha) = 0 \}\)\)称为映射\(\sigma\),记作$ Ker \sigma$。

如果\(\sigma\)\(K^n \rightarrow K^s\)的一个线性映射,则\(Ker \ \sigma\)\(K^n\)的一个子空间。

对于齐次线性方程组\(Ax=0\),线性映射\(A\)的核就是方程组的解空间:\(Ker \ A = W\)

由于上述\(dim \ W = n - rank(A) = n - dim<a_1,a_2,...,a_n>\),即秩-零化度定理\(dim \ Ker \ A + dim \ Im \ A = dim \ K^n\)

矩阵的相抵与相似


$Def. 1 $ 设数域\(K\)\(s \times n\)矩阵\(A\)的秩为\(r>0\),则\(A\)相抵于矩阵\(\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}\),称为\(A\)的相抵标准型。

$Def. 2 $ 数域\(K\)上矩阵\(A\)\(B\)相抵当且仅当秩相等,\(rank(A) = rank(B)\)

因此,存在\(K\)上的s阶,n阶可逆矩阵\(P,Q\)使得:

\[ A = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q \]

$Exercise. $ 设\(A\)为数域\(K\)上的\(s \times n\)矩阵,证明:\(rank(A)\)当且仅当存在\(s \times r\)列满秩矩阵\(B\)\(r \times n\)行满秩矩阵\(C\),使得\(A=BC\)

必要性:

\[ \begin{aligned} A =& P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q \\ =& (P_{s \times r}, \ P_{s \times (s-r)}) \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} Q_{r \times n} \\ Q_{(n-r) \times n} \end{pmatrix} \\ =& (P_{s \times r}, 0) \begin{pmatrix} Q_{r \times n} \\ Q_{(n-r) \times n} \end{pmatrix} = P_{s \times r} Q_{r \times n} = BC \end{aligned} \]

由于\(P,Q\)可逆,因此\(rank(P_{s \times r})=rank(Q_{r \times n}) = r\)

充分性:$ rank(B) + rank(C) - r \leq rank(BC) \leq rank(B) = r\(,显然\)rank(A) = rank(BC) =r$

$Exercise. $ 设\(B_1,B_2\)是数域\(K\)上的\(s \times r\)列满秩矩阵,证明:存在\(K\)上的s阶可逆矩阵\(P\),使得\(B_1 = PB_2\)

易知:存在s阶可逆矩阵使得\(P_1 B_1 = \begin{pmatrix} I_r \\ 0 \end{pmatrix}\)\(P_2 B_2 = \begin{pmatrix} I_r \\ 0 \end{pmatrix}\)

所以\(P_1 B_1=P_2 B_2 \ \rightarrow \ B_1= (P_1^{-1}P_2)B_2\),因此\(P=P_1^{-1}P_2\)为s阶可逆矩阵。

\(Exercise. \(设\)K\)上的\(A_{s \times n},B_{n \times m}\),证明:\(ABX_{m \times n} =A\)有解1的充分必要条件是:

\[ rank(AB) = rank(A) \]

因为矩阵方程\(ABX = A\)有解,则\(rank(AB) = rank(AB,A)\),说明$ rank(A) \leq rank(AB) \(,又因为\)rank(AB) \leq rank(A)\(,所以\)rank(AB) = rank(A)$

广义逆矩阵


对于线性方程组\(Ax=\beta\),若\(A\)不可逆但有解,需要引入广义逆矩阵\(A^{-}\)来简洁表示解。

$Def. 1 $ 设\(A\)是数域\(K\)上的\(s \times n\)非零矩阵,则

$$

AXA = A

$$

一定有解。每一个解都称为\(A\)的一个广义逆矩阵\(A^{-}\)

因此,\(Ax=\beta\)有解时,它的通解为\(x = A^{-} \beta\)

$Def. 2 $ 数域\(K\)上n元齐次线性方程组\(Ax=0\)的通解为:

\[ x = (I_n - A^{-}A)Z \]

其中\(A^{-}\)\(A\)任意给定的广义逆,\(Z\)取遍\(K^n\)中的任意列向量。

结合上述两个定义,可知对于数域\(K\)上的非齐次线性方程组\(Ax=\beta\),它的通解为:

\[ x = A^{-} \beta + (I_n - A^{-}A)Z \]

显然广义逆并不唯一

$Def. 3 $ Penrose方程组:设\(A\)复数域上的\(s \times n\)矩阵,矩阵方程组:

\[ \begin{cases} AXA = A \\ XAX = X \\ (AX)^* = AX \\ (XA)^* = XA \end{cases} \]

得到的解为\(A\)\(Moore-Penrose\)广义逆,记作\(A^{+}\)。其中\((AX)^*\)表示把\(AX\)的所有元素取共轭复数再转置得到的矩阵。

$Def. 4 $ 若\(A\)是复数域上的\(s \times n\)非零矩阵,则\(A\)的Penrose方程组始终有唯一解。设\(A=BC\),其中\(B\)是列满秩矩阵,\(C\)是行满秩矩阵,则唯一解为:

\[ X = C^*(CC^*)^{-1} (B^*B)^{-1}B^* \]

即对于任意的复矩阵\(A\)\(A\)\(Moore-Penrose\)广义逆\(A^+\)存在且唯一。

$Exercise. $ 设\(B,C\)分别为复数域上的\(s \times r,\quad r \times n\)列满秩、行满秩矩阵,则:

\[ (BC)^+ = C^+ B^+ \]

上述已知

\[ A^+ = (BC)^+ = C^*(CC^*)^{-1} (B^*B)^{-1}B^* \]

由于\(B=BI_r,C=I_r C\),所以

\[ \begin{aligned} B^+ = I^*_r (I_r I_r^*)^{-1} (B^* B)^{-1} B^* = (B^* B)^{-1} B^* \\ C^+ = C^* (C C^*)^{-1} \\ \end{aligned} \]

所以\(C^+ B^+ = C^* (C C^*)^{-1} (B^* B)^{-1} B^* = (BC)^+\)

$Exercise. $ 设\(A\)分别为复数域上的\(s \times n\)矩阵,证明:\(B\)\(A\)的一个广义逆的充分必要条件是:

\[ rank(A) + rank(I_n - BA) = n \]

由上述可知,\(B\)\(AXA = A\)的解,即\(ABA = A \ \rightarrow \ A(I_n - BA) = 0\)。因此\(rank(A) + rank(I_n - BA) = n\)

$Exercise. $ 设\(A\)分别为数域上的\(s \times n\)非零矩阵,证明:$$rank(A^{-}A) = rank(A) $$

已知:

\[ A = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q, \quad A^{-} = Q^{-1} \begin{pmatrix} I_r & B \\ C & D \end{pmatrix} P^{-1} \]

则:

\[ A^{-}A = Q^{-1} \begin{pmatrix} I_r & B \\ C & D \end{pmatrix} P^{-1} P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q = Q^{-1} \begin{pmatrix} I_r & 0 \\ C & 0 \end{pmatrix} Q \]

易得\(rank(A^{-}A) = rank \begin{pmatrix} I_r & 0 \\ C & 0 \end{pmatrix} \geq r \(,又因为\)rank(A^{-}A) \leq rank(A) =r\),所以\(rank(A^{-}A) = rank(A) = r\)

$Exercise. $ 设\(A,B,C\)分别为数域上的\(s \times n,l \times m, s \times m\)非零矩阵,证明:存在广义逆\(A^{-},B^{-}\)使得:

\[ rank \begin{pmatrix} A & C \\ 0 & B \end{pmatrix} = rank(A) + rank(B) +rank[(I_s - AA^{-})C(I_m - B^{-}B)] \]

假设\(rank(A)=r,rank(B)=t\),则:

\[ A^{-} = Q^{-1}_1 \begin{pmatrix} I_r & G_1 \\ H_1 & D_1 \end{pmatrix} P_1^{-1}, \quad B^{-} = Q^{-2}_2 \begin{pmatrix} I_t & G_2 \\ H_2 & D_2 \end{pmatrix} P_2^{-1} \]

取其中的\(G_1=0,H_2=0\):

\[ AA^{-} = P_1 \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1}_1, \quad B^{-}B = Q^{-1}_2 \begin{pmatrix} I_t & 0 \\ 0 & 0 \end{pmatrix} Q_2 \]
\[ (I_s - AA^{-})C(I_m - B^{-}B) = P_1 \begin{pmatrix} 0 & 0 \\ 0 & I_{s-r} \end{pmatrix} P_1^{-1} C Q_2^{-1} \begin{pmatrix} 0 & 0 \\ 0 & I_{m-t} \end{pmatrix} Q_2 \]

假设\(P_1^{-1} C Q_2^{-1} = \begin{pmatrix} C_1 & C_2 \\ C_3 & C_4 \end{pmatrix}\),则:

\[ (I_s - AA^{-})C(I_m - B^{-}B) = P_1 \begin{pmatrix} 0 & 0 \\ 0 & C_4 \end{pmatrix} Q_2 \]

即:\(rank[(I_s - AA^{-})C(I_m - B^{-}B)] = rank(C_4)\)

$$ \begin{aligned} &\begin{pmatrix} P_1^{-1} & 0 \ 0 & P_2^{-1} \end{pmatrix} \begin{pmatrix} A & C \ 0 & B \end{pmatrix} \begin{pmatrix} Q_1^{-1} & 0 \ 0 & Q_2^{-1} \end{pmatrix}= \begin{pmatrix} P_1{-1}AQ_1 & P_1{-1}CQ_2 \ 0 & P_2{-1}BQ_2 \} \ \end{pmatrix

&= \begin{pmatrix} I_r & 0 & C_1 & C_2 \
0 & 0 & C_3 & C_4 \ 0 & 0 & I_t & 0 \ 0 & 0 & 0 & 0 \ \end{pmatrix}

= \begin{pmatrix} I_r & 0 & 0 & 0 \
0 & 0 & I_t & 0 \ 0 & 0 & 0 & C_4 \ 0 & 0 & 0 & 0 \ \end{pmatrix} \end{aligned} $$

可知\(rank \begin{pmatrix} A & C \\ 0 & B \end{pmatrix} = rank(A) + rank(B) +rank(C_4) = rank(A) + rank(B) +rank[(I_s - AA^{-})C(I_m - B^{-}B)]\)

矩阵的相似


$Def. 1 $ 设\(A\)\(B\)都是数域上的\(n\)阶矩阵,若存在数域上的\(n\)阶可逆矩阵\(P\),使得\(P^{-1}AP=B\),则称\(A\)\(B\)相似,记作\(A \sim B\)

  • 相似矩阵的行列式的值相等:\(det(A) = det(B)\)

  • 相似矩阵或可逆或不可逆,若可逆,则逆矩阵也相似

  • 相似矩阵的秩相等:\(rank(A) = rank(B)\)

  • 相似矩阵的迹相等:\(tr(A) = tr(B)\)

  • \(f(x)=a_0+a_1x+...+a_m x^m\)是数域\(K\)上的一元多项式,若\(A \sim B\),则\(f(A) \sim f(B)\)

  • \(A_i \sim B_i, \ i=1,2\),则\(\(\begin{pmatrix} A_1 & 0 \\ 0 & A_2 \end{pmatrix} \sim \begin{pmatrix} B_1 & 0 \\ 0 & B_2 \end{pmatrix}\)\)

  • \(A\)可逆,则\(AB \sim BA\)。因为\(B = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} A^{-1} \ \rightarrow \ BA = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} \ \rightarrow \ P^{-1} (BA) P = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} = (AB) P\)

若n阶矩阵\(A\)能够相似于一个对角矩阵,则称为\(A\)可对角化,\(P^{-1}AP=diag\{ \lambda_1, \lambda_2, ...,\lambda_n \}\)

  • \(A\)可对角化,则\(A \sim A^T\)

$Def. 2 $ 数域\(K\)上n阶矩阵\(A\)可对角化的充分必要条件:\(K^n\)中有n个线性无关的列向量\(\mathbf{a_1,a_2,...,a_n}\),以及\(K\)中的n个数\(\lambda_1, \lambda_2, ..., \lambda_n\),使得$$A \mathbf{a_i} = \lambda_i \mathbf{a_i}, \quad i=1,2,...,n $$

\(P = (\mathbf{a_1,a_2,...,a_n})\),则\(\(P^{-1}AP = diag\{ \lambda_1, \lambda_2, ..., \lambda_n \}\)\)

特征值


$Def. 1 $ 设\(A\)是数域\(K\)上的n阶矩阵,若\(K^n\)中有非零列向量\(\mathbf{a}\)使得:

\[ A \mathbf{a} = \lambda_0 \mathbf{a} \]

则称\(\lambda_0\)是矩阵\(A\)的一个特征值,\(\mathbf{a}\)\(A\)对应于特征值\(\lambda_0\)的特征向量。

  • \(\lambda_0\)\(A\)的一个特征值当且仅当\(\lambda_0\)是特征多项式\(|\lambda I - A|=0\)\(K\)的一个根

  • \(\mathbf{a}\)\(A\)的属于\(\lambda_0\)的一个特征向量当且仅当\(\mathbf{a}\)是齐次线性方程组\((\lambda_0 I - A) \mathbf{x} = \mathbf{0}\)的一个非零解

  • \(A \sim B\),则\(|\lambda I -B|=|\lambda I -A|\)

  • 相似矩阵具有相同的特征数(重数也相同)

  • 对于齐次线性方程组\((\lambda_j I-A)x=0\)的一个基础解系:\(\eta_1,\eta_2,...,\eta_t\),则\(A\)属于\(\lambda_j\)的全部特征向量组成的集合为:

\[ \{ k_1 \eta_1 + k_2 \eta_2+...+ k_t \eta_t \ | \ k_1,k_2,...,k_t \in K,\text{且不全为0} \} \]
  • \(\lambda_1\)作为\(A\)的特征多项式的根的重数叫做\(\lambda_1\)的代数重数,把\(A\)的属于\(\lambda_1\)特征子空间的维数叫做\(\lambda_1\)的几何重数(几何重数不超过代数重数)

  • \(f(x)=a_0+a_1 x+...+a_m x^m\)是数域\(K\)上的一个多项式。证明:若\(\lambda_0\)\(K\)上n阶矩阵\(A\)的一个特征值,且\(\mathbf{a}\)是对应的一个特征向量。那么\(f(\lambda_0)\)\(f(A)\)的一个特征值,且\(\mathbf{a}\)\(f(A)\)的属于\(f(\lambda_0)\)的一个特征向量。

矩阵可对角化的条件


$Def. 1 $ 数域\(K\)上n阶矩阵\(A\)可对角化的充分必要条件为:\(A\)有n个线性无关的特征向量\(\mathbf{a_1,a_2,...,a_n}\),即:

\[ P=(\mathbf{a_1,a_2,...,a_n}) \]

\(P^{-1} A P = diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\),其中\(\lambda_i\)\(\mathbf{a_i}\)所属的特征值。这个对角矩阵\(diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\)\(A\)的相似标准形。

若各组向量数之和\(r_1+r_2+...+r_m<n\),则\(A\)没有n个线性无关的特征向量,因此\(A\)不可对角化。(不同特征值对应的特征向量互相线性无关)

  • 若数域\(K\)上的n阶矩阵\(A\)可对角化的充分必要条件:\(A\)的特征多项式的全部复根属于\(K\),且每个特征值的几何重数等于代数重数

实对称矩阵的对角化


坐标变换的实例:对于二次曲线在笛卡尔坐标系下的方程

\[ x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz - 1 =0 \]

通过直角坐标变换,消去方程中的交叉项,只留下平方项(\(\mathbf{T}\)是正交矩阵,\(T^{-1}=T^T\)):

\[ \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} = \mathbf{T} \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} \]
\[ \begin{aligned} x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz = \\ \begin{pmatrix} x \ \ y \ \ z \end{pmatrix} \begin{pmatrix} 1 & -2 & -4 \\ -2 & 4 & -2 \\ -4 & -2 & 1 \\ \end{pmatrix} \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} \\ \end{aligned} \]

代入后得到:

\[ \begin{pmatrix} x^* \ \ y^* \ \ z^* \end{pmatrix} \mathbf{T^T A T} \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} \\ \]

显然\(A\)是实数域上的对称矩阵(\(A=\bar{A}\)),为了使得方程只留下平方项,需要\(T^T A T(T^{-1}AT)\)为对角矩阵,即\(A\)可对角化。

若n阶实矩阵\(A,B\)存在一个n阶正交矩阵\(T\),使得\(T^{-1}AT=B\),则\(A\)正交相似于\(B\)

  • 实对称矩阵的特征多项式的每一个复根都是实数,从而它们都是特征值

  • 实对称矩阵\(A\)的属于不同特征值的特征向量是正交的\((\mathbf{a_1,a_2})=0\)

  • 实对称矩阵一定正交相似于对角矩阵(\(T^{-1}AT=diag\{\lambda_1,\lambda_2,...,\lambda_n \}\)

  • n阶实矩阵\(A\)正交相似于一个对角矩阵\(D\),则\(A\)一定是对称矩阵,\(T^{-1}AT=D, \ A^T = (TDT^{-1})^T = TDT^{-1} = A\)

二次型


$Def. 1 $ 数域\(K\)上的一个n元二次型是系数在\(K\)中的n个变量的二次齐次多项式:

\[ f(x_1,x_2,...,x_n) = \sum_{i=1}^{n} \sum_{j=1}^{n} a_{ij} x_i x_j \]

其中\(a_{ij}=a_{ji}, \ 1 \leq i,j \leq n\)

所有系数可排成一个n阶矩阵\(A\)。称为二次型\(f(x_1,...,x_n)\)的矩阵,显然\(A\)是对称且唯一的,主对角元是\(x_1^2,x^2_2,...,x^2_n\)的系数,\((i,j)\)元是\(x_i x_j\)的系数的一半:

\[ A = \begin{pmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{12} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ... & a_{nn}\\ \end{pmatrix}, \ X = \begin{pmatrix} x_1 \\ x_2 \\ ...\\ x_n \\ \end{pmatrix} \]

因此二次型\(f(x_1,...,x_n)\)可以表示为:\(\(f(x_1,...,x_n) = X^T A X\)\)

\(Y=\begin{pmatrix} y_1 \\ y_2 \\ ...\\ y_n \\ \end{pmatrix}\),设\(C\)是数域\(K\)上的n阶可逆矩阵,则存在:

\[ X = CY \]

称为变量\(x_1,x_2,...,x_n\)\(y_1,...,y_n\)的非退化线性替换

\[ X^T AX = (CY)^T A (CY) = Y^T (C^T A C) Y \]

\(B=C^{T}AC\),则\(X^{T} A X = Y^{T} B Y\)\(B\)也是对称矩阵。

$Def .2 $ 对于数域\(K\)上的两个n元二次型\(X^{T} A X\)\(Y^{T}BY\),若存在一个非退化线性替换\(X=CY\),使得\(X^{T}AX\)转换为\(Y^{T}BY\),那么两者等价,记作\(\(X^{T}AX \simeq Y^{T}BY\)\)

$Def.3 $ 数域\(K\)上两个n阶矩阵\(A,B\),若存在\(K\)上一个n阶可逆矩阵\(C\),使得:

\[ C^{T} A C = B \]

则称\(A\)\(B\)合同,记作\(A \simeq B\)

  • 当两个n元二次型\(X^{T}AX,Y^{T}BY\)等价当且仅当n阶矩阵\(A,B\)合同

  • 若二次型\(X^{T}AX\)等价于一个只含平方项的二次型,称为标准形

  • 若对称矩阵\(A\)合同于一个对角矩阵,则称为合同标准形

对于n阶实对称矩阵\(A\),存在一个n阶正交矩阵\(T\),使得\(T^{-1}AT\)是对角矩阵\(diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\),其中\(\lambda_1,\lambda_2,...,\lambda_n\)\(A\)的特征值。因为\(T^{-1} = T^T\),因此\(A\)合同于\(diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\)

因此,\(X=TY\)称为正交替换

  • 数域\(K\)上任一对称矩阵都合同于一个对角矩阵

  • 数域\(K\)上任一n元二次型都等价于一个只含平方项的二次型。(方法:成对的初等行、列变换法)

  • 数域\(K\)上n元二次型\(X^{T}AX\)的任一标准形中,系数不为0的平方项个数等于矩阵\(A\)的秩,\(rank(A)=r\)

$Exercise. $ 将二次曲面方程化作标准方程:

\[ x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz + 2x + y + 2z - \frac{25}{16} = 0 \]

取二次项部分:\(f(x,y,z)=x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz\),二次型矩阵为:

\[ \begin{pmatrix} A = \begin{pmatrix} 1 & -2 & -4 \\ -2 & 4 & -2 \\ -4 & -2 & 1 \\ \end{pmatrix} \\ |\lambda I - A| = (\lambda +4 )(\lambda - 5)^2 = 0 \\ \end{pmatrix} \]

通过特征值为5,5,-4,易得特征向量\(a_1,a_2,a_3\),通过施密特正交化和单位化得到\(\eta_1,\eta_2,\eta_3\)。因此,得到正交矩阵\(T\):

\[ \begin{aligned} T =& (\eta_1,\eta_2,\eta_3) \\ T^{-1} A T = T^{T}A & T = diag\{ 5,5,-4 \} \end{aligned} \]

作正交替换,使得二次型\(f(x,y,z)\)化为标准形\(5{x'}^2 + 5{y'}^2-4{z'}^2\)

\[ \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} = T \begin{pmatrix} x' \\ y' \\ z' \\ \end{pmatrix} \]

得到二次曲面的新方程:

\[ \begin{aligned} 5{x'}^2 + 5{y'}^2 - 4{z'}^2 + 3z' - \frac{25}{16} = 0 \\ 5{x'}^2 + 5{y'}^2 - 4{(z' - \frac{3}{8})}^2 - 1 = 0 \\ \end{aligned} \]

作移轴:

\[ \begin{cases} x^* = x' \\ y^* = y' \\ z^* = z' - \frac{3}{8} \\ \end{cases} \]

则方程转变为:\(5 {x^*}^2 + 5 {y^*}^2 - 4{z^*}^2 = 1\)

因此,总的直角坐标变换公式为:

\[ \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} = T \begin{pmatrix} x^* \\ y^* \\ z^* + \frac{3}{8} \\ \end{pmatrix} = T \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} + T \begin{pmatrix} 0 \\ 0 \\ \frac{3}{8} \\ \end{pmatrix} = T \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} + \begin{pmatrix} \frac{1}{4} \\ \frac{1}{8} \\ \frac{1}{4} \\ \end{pmatrix} \]

$Exercise. $ 设\(A\)是数域\(K\)上的n阶矩阵,证明:\(A\)是斜对称矩阵当且仅当对于\(K^n\)中任一列向量\(\mathbf{a}\),有\(\mathbf{a}^T A \mathbf{a} = 0\)

  • 必要性:因为\(A\)是斜对称矩阵,所以\(A^T = -A\),因此\((\mathbf{a}^T A \mathbf{a})^T = \mathbf{a}^T A^T \mathbf{a} = -\mathbf{a}^T A \mathbf{a} = 0\),因此\(\mathbf{a}^T A \mathbf{a} = 0\)

  • 充分性:设\(A\)的列向量\(\mathbf{a_1,a_2,...,a_n}\),已知\(\epsilon_i^T A \epsilon_i = \epsilon_i^T \mathbf{a_i} = a_{ii} = 0, \quad i=1,2,...,n\)\((\epsilon_i + \epsilon_j)^T A (\epsilon_i + \epsilon_j) = (\epsilon_i + \epsilon_j)^T (\mathbf{a_i} + \mathbf{a_j}) = a_{ii} + a_{ij} + a_{ji} + a_{jj} = a_{ij} + a_{ji}, \quad i \neq j\),因此是\(A\)斜对称矩阵

\(Exercise.\) 设n阶实对称矩阵\(A\)的全部特征值按大小顺序排成\(\lambda_1 \geq \lambda_2 \geq ... \geq \lambda_n\)。证明:对于\(R^n\)中任一非零列向量\(\mathbf{a}\),都有\(\(\lambda_n \leq \frac{\mathbf{a}^T A \mathbf{a}}{|\mathbf{a}|^2} \leq \lambda_1\)\)

因为\(A\)为n阶实对称矩阵,因此存在正交矩阵\(T\),使得\(T^{-1}AT = diag\{ \lambda_1,\lambda_2,...,\lambda_n \}\),设\(\mathbf{a}\)为一个\(R^n\)中的非零列向量,\((T \mathbf{a})^T = (b_1,b_2,...,b_n)\),因此:

\[ \begin{aligned} \mathbf{a}^T A \mathbf{a} =& \mathbf{a}^T T \ diag\{ \lambda_1,\lambda_2,...,\lambda_n \} \ T \mathbf{a} = (T \mathbf{a})^T diag\{ \lambda_1,\lambda_2,...,\lambda_n \} (T \mathbf{a}) \\ =& \lambda_1 b^2_1 + \lambda_2 b^2_2 + ... + \lambda_n b^2_n \\ \end{aligned} \]

显然,\(\lambda_n |\mathbf{a}|^2 \leq \mathbf{a}^T A \mathbf{a} \leq \lambda_1 (b_1^2 + b_2^2 + ... + b_n^2) = \lambda_1 |\mathbf{a}|^2\)

因此:\(\(\lambda_n \leq \frac{\mathbf{a}^T A \mathbf{a}}{|\mathbf{a}|^2} \leq \lambda_1\)\)

实二次型的规范形


实二次型\(X^T AX\)的规范形是:

\[ z_1^2 + z_2^2 + ... + z_p^2 - z_{p+1}^2 - ... - z_r^2 \]

规范形只含平方项,且系数为1,-1,0,系数为1的平方项写在前面,其中平方项的个数等于矩阵\(A\)的秩\(rank(A)\)

\(Def. 1 \ \(惯性定理:n元实二次型\)X^T AX\)的规范形是唯一的。

  • 其中,系数为+1的平方项个数\(p\)称为二次型的正惯性指数,系数为-1的平方项个数\(r-p\)称为二次型的负惯性指数。正惯性指数减去负惯性指数的差\(2p-r\)称为\(X^TAX\)的符号差。

  • 两个n元实二次型等价$ \leftrightarrow \(规范形相同\) \leftrightarrow $秩相等,且正惯性指数相等

  • \(A\)合同于对角矩阵\(diag\{ 1,...,1,-1,...,-1,0,...,0 \}\)(1的个数等于正惯性指数,-1的个数等于负惯性指数),则其为\(A\)的合同规范形

  • 两个n阶实对称矩阵合同$ \leftrightarrow $秩相等,正惯性指数相等

复二次型的规范形


设n元复二次型\(X^T AX\)通过一个非退化线性替换\(X=CY\)转换成标准形:

\[ d_1 y^2_1 + d_2 y^2_2 + ... + d_r y^2_r \]

\(r\)即为二次型的秩,\(d_i \neq 0 , \ i=1,2,...,r\)。假设\(d_j=r_j (cos \theta_j + i \ sin\theta_j), \ 0 \leq \theta_j < 2 \pi\),易得:

\[ d_j = [± \sqrt{r_j} (cos \frac{\theta_j}{2} + i \ \frac{sin\theta_j}{2}) ]^2 \]

因此将\(\sqrt{r_j} (cos \frac{\theta_j}{2} + i \ \frac{sin\theta_j}{2})\)记作\(\sqrt{d_jd_j}\),则再作非退化线性替换为:

\[ \begin{cases} y_j = \frac{1}{\sqrt{d_j}} z_j, \ j=1,2,...,r\\ y_l = z_l, \ l=r+1,r+2,...,n \end{cases} \]

因此\(X^T AX\)的标准形:

\[ z_1^2 + z_2^2 + ... + z_r^2 \]

便是复二次型\(X^T AX\)的规范型,只含平方项,且系数为1或0。复二次型\(X^T AX\)的规范型完全由秩决定。

  • 复二次型\(X^T AX\)的规范形是唯一的

  • 两个n元复二次型等价$ \leftrightarrow \(规范形相同\) \leftrightarrow $秩相等

  • 任一n阶复对称矩阵\(A\)合同于对角矩阵\(\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}\),其中\(r=rank(A)\)

  • 两个n阶复对称矩阵合同$ \leftrightarrow $秩相等

正定二次型


若对于\(R^n\)中任意非零列向量\(\mathbf{a}\),都由\(\mathbf{a}^T A \mathbf{a} > 0\),则称\(X^T AX\)为正定二次型。

  • n元实二次型\(X^T AX\)正定,当且仅当其正惯性指数等于n,其规范形为:$$y_12+y_22+...+y^2_n $$

  • n元实二次型\(X^T AX\)是正定的 $ \leftrightarrow $ \(A\)的正惯性指数等于n $ \leftrightarrow $ \(A\)合同于对角矩阵\(I_n\),即\(A \simeq I_n\) $ \leftrightarrow $ \(A\)的特征值全为正

  • 与正定矩阵合同的实对称矩阵也是正定矩阵

  • 非退化线性退化不会给改变实二次型的正定性

  • 正定矩阵的行列式大于0,\(A=C^T I_n C,|A|=|C^T C| = |C|^2>0\)

$Def. 1 $ 若对于\(R^n\)中任一非零列向量\(\mathbf{a}\),都有:

\[ \mathbf{a}^T A \mathbf{a} \geq 0,\quad (\mathbf{a}^T A \mathbf{a} < 0, \ \mathbf{a}^T A \mathbf{a} \leq 0) \]

则该n元实二次型\(X^T AX\)称为半正定(负定,半负定)。

  • n元实二次型\(X^T AX\)是半正定\(\ \leftrightarrow \$正惯性指数等于秩\) \leftrightarrow $规范形为\(y_1^2+...+y_r^2\) $ \leftrightarrow $标准形中n个系数均非负

$Def. 2 $ 黑塞(Hesse)矩阵:设二元实值函数\(F(x,y)\)有一个稳定点\(\mathbf{a}=(x_0,y_0)\),即在该点的一阶偏导数全为0,设\(F(x,y)\)\((x_0,y_0)\)的一个邻域里有3阶连续偏导数,令:

\[ \mathbf{H} = \begin{pmatrix} F''_{xx}(x_0,y_0) & F''_{xy}(x_0,y_0) \\ F''_{xy}(x_0,y_0) & F''_{yy}(x_0,y_0) \end{pmatrix} \]

\(\mathbf{H}\)\(F(x,y)\)\((x_0,y_0)\)处的黑塞矩阵。若黑塞矩阵\(\mathbf{H}\)正定,则\(F(x,y)\)\((x_0,y_0)\)处具有极小值。若负定,则\(F(x,y)\)\((x_0,y_0)\)处具有极大值。

\(F(x,y)\)\((x_0,y_0)\)处展开为Talyor级数,得:

\[ F(x_0+h, y_0+k) = F(x_0,y_0) + [h F'_x(x_0,y_0) + k F'_y(x_0,y_0)] + \frac{1}{2} [h^2 F''_{xx}(x_0,y_0) + 2hk F''_{xy}(x_0,y_0) + k^2 F''_{yy}(x_0,y_0)] + R \]

\(a=F''_{xx}(x_0,y_0),b=F''_{xy}(x_0,y_0),c=F''_{yy}(x_0,y_0)\),则:

\[ f(h,k) = F(x_0+h, y_0+k) - F(x_0,y_0)= ah^2 + 2bhk + ck^2 + R \]

\(h,k\)的实二次型,其矩阵就是\(\mathbf{H}\)。若正定,则对于足够小的\(|h|,|k| \neq 0\),有

\[ F(x_0+h, y_0+k) - F(x_0,y_0) > 0 \]

表明\(F(x,y)\)\((x_0,y_0)\)处具有极小值。负定的情况相反,达到极大值。

推广到n元形式,设\(F(x_1,x_2,...,x_n)\)\(\mathbf{a}=(a_1,a_2,...,a_n)\)处有连续的3阶偏导数,则黑塞矩阵\(\mathbf{H}=(F''_{x_i x_j}(\mathbf{a}))\)