Higher Algebra: 矩阵
相关信息
相关阅读资料:
矩阵的性质
矩阵的逆:设\(A\)为n阶方阵,若存在n阶方阵\(B\),使得\(AB=BA=I_n\),则称\(A\)可逆,\(B\)为\(A\)的逆矩阵,记为\(A^{-1}\)。
若矩阵没有逆,则称矩阵为奇异阵,反之则称矩阵为非异阵或可逆阵。可逆矩阵经初等变换后仍是可逆矩阵,奇异阵经初等变换后仍是奇异阵。
设\(A\)是一个n阶可逆矩阵,则通过有限次的初等变换\(P_m...P_1 A\)就可以转化为单位矩阵\(I_n\)。(\(A = P_1^{-1}...P_m^{-1}\))
矩阵的相抵:若一矩阵\(A\)经过有限次初等变换后变成\(B\),则称\(A\)与\(B\)是等价的,或\(A\)与\(B\)相抵,记为\(A\sim B\).
对于任一矩阵\(A_{m \times n} = (a_{ij})_{m \times n}\)必相抵于下列\(m \times n\)矩阵:
即\(A \sim B\),任一\(m \times n\)矩阵均与一个主对角线上元素等于1或0而而其余元素均为0的\(m \times n\)矩阵相抵。
易得:对任意一个秩为\(r\)的\(m \times n\)矩阵\(A\),总存在\(m\)阶可逆阵\(P\)和\(n\)阶可逆阵\(Q\),使得:
关于矩阵的秩:
-
任意矩阵\(A\)的转置\(A^T\)与\(A\)具有相同的秩,即\(rank(A) = rank(A^T)\)
-
任意矩阵与可逆阵相乘,其秩不变
-
\(n\)阶方阵\(A\)为可逆阵的充分必要条件为\(A\)为满秩阵(\(rank(A) = n\))
-
两个\(m \times n\)矩阵等价的充分必要条件为它们具有相同的秩,即\(rank(A_{m \times n}) = rank(B_{m \times n})\)
-
对于给\(A_{m \times n}\)与\(B_{n \times s}\),有\(\(r(A) + r(B) -n \leq rank(AB) \leq min \{ r(A), r(B) \}\)\) 证明Sylvester不等式:\(\(\begin{pmatrix} I_n & 0 \\ 0 & AB \end{pmatrix} \sim \begin{pmatrix} I_n & 0 \\ A & AB \end{pmatrix} \sim \begin{pmatrix} I_n & A \\ -B & 0 \end{pmatrix} \sim \begin{pmatrix} -B & I_n \\ 0 & A \end{pmatrix}\)\) 因此\(r(A) + r(B) -n \leq rank(AB)\)显然成立。
矩阵分块
设矩阵\(A_{s \times} n\)与\(B_{n \times m}\),\(C_{s \times m}\),则\(B\)的列向量组为\(\beta_1,\beta_2,...,\beta_m\),则\(AB=A(\beta_1,\beta_2,...,\beta_m)=(A\beta_1,A\beta_2,...,A\beta_m)\)。\(C\)的列向量组\(\delta_1,\delta_2,...,\delta_m\)。
对于\(AB=C\)可以看作\((A\beta_1,A\beta_2,...,A\beta_m)=(\delta_1,\delta_2,...,\delta_m) \ \rightarrow \ A \beta_j = \delta_j \ (j=1,2,...,m)\),即\(\beta_j\)是\(Ax=\delta_j\)的一个解。
$Exercise. $ 证明:设\(A_{s \times n},B_{n \times m}\),若\(AB=0\),证明:\(rank(A)+rank(B) \leq n\)。
\(B\)的列向量组为\(\beta_1,\beta_2,...,\beta_m\)。显然\(\beta_j\)属于\(Ax=0\)的解空间\(W\),则\(rank(B) = dim<\beta_1,\beta_2,...,\beta_m> \leq dim \ W = n - rank(A)\)。即为\(rank(A)+rank(B) \leq n\)
n维向量空间
$Def.1 $ 定义数域\(K\)上所有\(n\)元有序数组组成的几何\(K^n = \{ (a_1,a_2,...,a_n) | a_i \in K, \ i=1,2,...,n \}\),连同定义在其上面的加法运算和数乘运算,及其满足的运算法则,称为数域\(K\)上的一个\(n\)维向量空间。
$Def.2 $ 若\(K^n\)的一个非空子集\(U\)满足:(1)\(\mathbf{\alpha,\gamma} \in U \ \rightarrow \ \mathbf{\alpha + \gamma} \in U\) ;(2)\(\mathbf{\alpha} \in U, \ k \in K \ \rightarrow \ k\mathbf{\alpha} \in U\),则称\(U\)为\(K^n\)的一个线性子空间(加法封闭、数乘封闭)。
\(Exercise. \ \(假设\)\mathbf{a_1,...,a_s}\)线性无关,有:
证明:\(\mathbf{b_1},...,\mathbf{b_s}\)线性无关的充分必要条件是:\(\(\begin{vmatrix} a_{11} & ... & a_{s1} \\ ... & & ... \\ a_{1s} & ... & a_{ss} \end{vmatrix} \neq 0\)\)
设\(k_1 \mathbf{b_1} + ... + k_s \mathbf{b_s} = 0\),即为\((k_1 a_{11}+...+k_s a_{s1}) \mathbf{a_1} + ...+ (k_1 a_{1s}+...+k_s a_{ss}) \mathbf{a_s} = 0\)。已知\(\mathbf{a_1,...,a_s}\)线性无关:
若\(|A| \neq 0\),则以上齐次线性方程只有零解,\(k_1=0,...k_s=0\),\(\mathbf{b_1},...,\mathbf{b_s}\)线性无关
$Def.3 $向量组的极大线性无关组所含的向量个数称为这个向量组的秩。
若向量组\(\mathbf{a_1,...,a_s}\)可以由向量组\(\mathbf{b_1,...,b_s}\)线性表出,则\(rank(\mathbf{a_1,...,a_s}) \leq rank(\mathbf{b_1,...,b_s})\)。等价的向量组有相同的秩,但秩相同的向量组不一定等价(除非满秩)。因此,两个向量组等价的充分必要条件是:秩相同且其中一个向量组能由另一个向量组线性标出。
\(Def.4 \ \(设\)U\)是\(K^n\)的一个子空间,若线性无关的向量组\(\mathbf{a_1,...,a_s} \in U\),且\(U\)的每个向量都可由\(\mathbf{a_1,...,a_s}\)线性表出,则称\(\mathbf{a_1,...,a_s}\)为\(U\)的一个基。基所含的向量个数为\(U\)的维数,记作\(dim_K(U) = s\)。(显然\(dimK^N = n\))
若\(U\)与\(W\)均为\(K^n\)的非零子空间,且\(U \subseteq W \(,那么\)U\)的基\(\mathbf{a_1,...,a_r}\)可由\(W\)的基\(\mathbf{\eta_1,...,\eta_t}\)线性表出,\(r \leq t\),因此\(dim \ U \leq dim \ W\)
$Def.5 $ 数域\(K\)上n元齐次线性方程组\(AX=0\)的解空间\(W\)的维数\(dim \ W = n - rank(A)\)
证明;因为\(rank(A) = r\),则\(AX=0\)可写成如下:
可得线性无关的n-r个解\(\mathbf{\eta_1,...,\eta_{n-r}}\),即:
取其中一个解\(\mathbf{\eta} = (c_1,...,c_n)^T\),则:
$$ \begin{aligned}
\mathbf{\eta} =& \begin{pmatrix} c_1 \ ... \ c_r \ c_{r+1} \ ... \ c_n \end{pmatrix} = \begin{pmatrix} -b_{1,r+1} c_{r+1}& -& ...& -& b_{1,n} c_{n}& \ ... \ -b_{r,r+1} c_{r+1}& -& ...& -& b_{r,n} c_{n}& \ 1 c_{r+1}& +& ...& -& 0 c_{n}& \ ... \ 0 c_{r+1}& +& ...& -& 1 c_{n}& \ \end{pmatrix} \
=& c_{r+1} \mathbf{\eta}1 +...+ c \end{aligned} $$} \mathbf{\eta}_{n-r
显然每一个解都可由\(\mathbf{\eta_1,...,\eta_{n-r}}\)线性表出(基础解系),所以\(\mathbf{\eta_1,...,\eta_{n-r}}\)是\(W\)的一个基,\(dim \ W = n-rank(A)\)
$Exercise. $ 设\(A\)是数域\(K\)上\(s \times n\)矩阵,证明:若对于\(K^n\)中任意一列向量\(\mathbf{\eta}\),都有\(A \mathbf{\eta}=0\),则\(A = 0\)。
即\(K^n\)中任意一列向量\(\mathbf{\eta}\)都是\(AX=0\)的解。解空间\(W=K^n\),可知\(dim \ W = n - rank(A) = n\),所以\(rank(A) = 0\),\(A=0\)。
正交矩阵
\(Def.1 \ \(实数域上的n阶矩阵\)A\)满足\(A^T A =I_n\),则\(A\)为正交矩阵。若\(A\)可逆,则\(A^{-1} = A^T,AA^{-1}=I_n\)。
-
正交矩阵\(A\)的\(A^T(A^{-1}\)也是正交矩阵
-
正交矩阵的行列式\(|A| = \pm 1\),因为\(det(A^T A) = det(I_n) = 1\),所以\(det(A)^2 = 1\),\(det(A) = \pm 1\)。
-
若\(A\)与\(B\)为正交矩阵,那么\(AB\)也是正交矩阵,因为\((AB)^T AB = A^T B^T AB = A^T I_n B = I_n\)。
-
对于实数域上的n阶矩阵\(A\)的行向量组\(\mathbf{\gamma_1,...,\gamma_n}\),行列向量组\(\mathbf{a_1,...,a_n}\)。满足:$$\gamma_i \gamma_j^T = \delta^j_i, a_i a_j^T = \delta^j_i, 1 \leq i,j \leq n $$
$Def. 2 $ 在\(R^n\)中任取\(\mathbf{a},\mathbf{b} \in R^n\),规定:\((\mathbf{a}, \mathbf{b})=\mathbf{a} \cdot \mathbf{b} = \mathbf{a}^T \mathbf{b} = \sum_{i=1}^n a_i b_i\)。则称\((\mathbf{a}, \mathbf{b})\)为\(R^n\)的一个标准内积(内积)。在n维向量空间\(R^n\)有了标准内积后,则\(R^n\)成为欧几里得空间。
若非零向量组中的向量两两正交,则称为正交向量组,且该向量组一定线性无关。若在欧几里得空间\(R^n\)中,n个向量组成的正交向量组一定是\(R^n\)的基(正交基)。n个单位向量组成的正交向量组为\(R^n\)的标准正交基。
$Def. 3 $ 施密特正交化:假设\(\mathbf{a_1,a_2,...,a_s}\)为欧几里得空间\(R^n\)中的一个线性无关向量组,则:
通过施密特正交化方法,将线性无关向量组\((\mathbf{a_1,...,a_s})\)正交化,得到正交向量组\((\mathbf{\beta_1,...,\beta_s})\)。
\(Exercise. \ \(设\)A\)是实数域上的n阶可逆矩阵,则\(A\)可以唯一分解为正交矩阵\(T\)与主对角元都为正数的上三角矩阵\(B\)之积:\(A = TB\)
证明:设可逆阵\(A\)的行向量组为\(\mathbf{a_1,...,a_n}\),则\(\mathbf{a_1,...,a_n}\)线性无关,且\(\mathbf{a_1,...,a_n}\)是\(R^n\)的标准正交基。设\(\mathbf{a_1,...,a_n}\)对应的正交向量组为\(\mathbf{\beta_1,...,\beta_n}\),根据施密特正交化,设\(b_{ji} = \frac{(\mathbf{a_j},\mathbf{\beta_i})}{(\mathbf{\beta_i},\mathbf{\beta_i})}, \ i=2,3,...,n; \ j=1,2,...,i-1\),则:
唯一性:\(TB = T_1 B_1 \ \rightarrow \ T_1^{-1} T = B_1 B^{-1}\)。显然\(T_1^{-1}T\)即为正交矩阵,也是上三角矩阵,易得其\(a^2_{kk}=1, \ k=1,2,...,n\),即为单位矩阵,所以\(B_1 B^{-1} = I_n\),\(B_1 = B,T_1 =T\)。
上述即为方阵的QR分解,我们可以将其推广到非方阵,设\(A\)是实数域上的\(m \times n\)矩阵(\(m>n\)),则\(A\)可以唯一分解为列向量为正交单位向量组的\(Q_{m \times n}\)与主对角元均为正数的\(n\)阶上三角矩阵\(R\)之积:\(A = QR\)。
$Def. 4 $ 假设\(U\)为欧几里得空间\(R^n\)的一个子空间,若向量\(\alpha\)与\(U\)中每一个向量正交,即\(\alpha \perp U\)。令\(U^\perp = \{ \mathbf{\alpha} \in R^n | \mathbf{\alpha} \perp U \}\),则\(U^\perp\)为\(R^n\)的一个子空间,称为\(U\)的正交补。
$Def. 5 $ 设\(U\)为欧几里得空间\(R^n\)的一个子空间,令
其中\(\mathbf{a_1} \in U\),且\(\mathbf{a} - \mathbf{a_1} \in U^{\perp}\),则称\(P_U\)为\(U\)的正交投影。\(\mathbf{a_1}\)称为向量\(\mathbf{a}\)在\(U\)上的正交投影。对于\(\mathbf{a} \in R^n\),有
$Exercise.1 $ 设\(A\)是实数域上的\(m \times n\)矩阵(\(m>n\)),\(\beta \in R^n\)。若有\(x_0 \in R^n\)使得\(|Ax_0 - \beta|^2 \leq |Ax - \beta|, \ \forall x \in R^n\),则\(x_0\)为线性方程\(Ax=\beta\)的最小二乘解,证明:\(x_0\)是线性方程\(Ax=\beta\)的最小二乘解当且仅当\(x_0\)是\(A^T Ax =A^T \beta\)的解
设\(U=<a_1,a_2,...,a_n>\)表示\(A\)的列空间,则
即\(Ax_0\)为\(\beta\)在子空间\(U\)上的正交投影,所以\(a_i^T (Ax_0 - \beta) = 0, \ i=1,2,...,n\)。易得\(A^T(Ax_0 - \beta) = \mathbf{0} \ \rightarrow \ A^T A x_0 = A^T \beta\),即\(x_0\)是\(A^T Ax =A^T \beta\)的解
$Exercise.2 $ 设\(A\)是实数域上的列满秩\(m \times n\)矩阵(\(m>n\)),其列空间记作\(U = <a_1,a_2,...,a_n> \subset R^m\)。证明\(P_A=A(A^TA)^{-1}A^T\)为\(R^m\)在\(U\)上的正交投影
任取\(X \in R^m\),由于\(((A^TA)^{-1}A^T) X\)为\(n \times 1\)矩阵,可设为\((c_1,c_2,...,c_n)^T\),则:
再证\(X - P_A X = (I_n - P_A)X \in U^{\perp} \subseteq R^m\),即
因此\((I_n - P_A)X \in U^{\perp}\),综上\(P_A=A(A^TA)^{-1}A^T\)是\(R^m\)在\(U\)上的正交投影。
$Def. 5 $ 若存在一个对应法则\(f\),使得集合\(S\)中的每一个元素\(a\),都有\(S'\)中唯一确定的元素\(b\)与之对应,则称\(f\)为\(S\)到\(S'\)的映射,记作\(f: S \rightarrow S'\),\(a \rightarrow b\)。\(b\)称为\(a\)在\(f\)下的象,\(a\)称为\(b\)在\(f\)下的一个原象。
映射\(f\)可记作:
\(S\)为映射\(f\)的定义域,\(S'\)为映射\(f\)的陪域,\(S\)的所有元素在\(f\)下的象组成的集合为\(f\)的值域或\(f\)的象,即\(f(S)\)或\(Im f\):
显然\(f\)的值域是\(f\)的陪域的子集。
-
若\(f(S) = S'\),则\(f\)为满射,\(f\)的陪域中的每个元素至少有一个原象
-
若对于\(a_1,a_2 \in S\),有\(f(a_1)=f(a_2) \ \rightarrow \ a_1=a_2\),则\(f\)为单射,\(f\)的定义域中的不同元素的象不同
-
若\(f\)既是单射又是满射,则\(f\)为双射,\(f\)的\(S\)与\(S'\)一一对应
-
集合\(S\)到数集的一个映射,称为\(S\)上的一个函数
-
陪域\(S'\)中的元素\(b\)在映射\(f\)下的所有原象组成的集合称为\(b\)在\(f\)下的原象集,记作\(f^{-1}(b)\)
$Def. 6 $ 映射\(g:S \rightarrow S'\)和\(f:S' \rightarrow S''\)得到\(S \rightarrow S''\)的一个映射\(fg\),称为\(f\)与\(g\)的乘积/合成:
$Def. 7 $ 设\(f:S \rightarrow S'\),存在一个\(g:S’ \rightarrow S\),使得$$ fg = 1_{S} \quad gf=1_{S'}\(\(,则称映射\)f\)是可逆的,\(g\)为\(f\)的一个唯一逆映射,可记作\(f^{-1}\)。
映射\(f:S \rightarrow S'\)可逆的充分必要条件为\(f\)是双射
$Def. 8 $ 数域\(K\)上的向量空间\(K^n \rightarrow K^s\)的一个映射\(\sigma\)若保持加法和数乘运算,即\(\forall \mathbf{a,b} \in K^n, \ k \in K\):
则\(\sigma\)为\(K^n\)到\(K^s\)的一个线性映射。显然矩阵\(A\)是一个线性映射。
假设数域\(K\)上n元线性方程组\(Ax=\beta\)有解,即存在\(\gamma \in K^n\)使得\(A \gamma = \beta\)。根据线性映射的概念,\(\beta \in Im \ A\)
显然\(\beta \in <\mathbf{a_1,a_2,...,a_n}>\),因此\(Im \ A = <\mathbf{a_1,a_2,...,a_n}>\),即线性映射\(A\)的象等于\(A\)的列空间,因此\(Im \ A\)是\(K^s\)的一个子空间。
$Def. 9 $ 设\(sigma\)是\(K^n \rightarrow K^s\)的一个映射,\(K^n\)的一个子集\(\(\{ \alpha \in K^n \ | \ \sigma(\alpha) = 0 \}\)\)称为映射\(\sigma\)的核,记作$ Ker \sigma$。
如果\(\sigma\)是\(K^n \rightarrow K^s\)的一个线性映射,则\(Ker \ \sigma\)是\(K^n\)的一个子空间。
对于齐次线性方程组\(Ax=0\),线性映射\(A\)的核就是方程组的解空间:\(Ker \ A = W\)
由于上述\(dim \ W = n - rank(A) = n - dim<a_1,a_2,...,a_n>\),即秩-零化度定理\(dim \ Ker \ A + dim \ Im \ A = dim \ K^n\)
矩阵的相抵与相似
$Def. 1 $ 设数域\(K\)上\(s \times n\)矩阵\(A\)的秩为\(r>0\),则\(A\)相抵于矩阵\(\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}\),称为\(A\)的相抵标准型。
$Def. 2 $ 数域\(K\)上矩阵\(A\)与\(B\)相抵当且仅当秩相等,\(rank(A) = rank(B)\)
因此,存在\(K\)上的s阶,n阶可逆矩阵\(P,Q\)使得:
$Exercise. $ 设\(A\)为数域\(K\)上的\(s \times n\)矩阵,证明:\(rank(A)\)当且仅当存在\(s \times r\)列满秩矩阵\(B\)与\(r \times n\)行满秩矩阵\(C\),使得\(A=BC\)
必要性:
由于\(P,Q\)可逆,因此\(rank(P_{s \times r})=rank(Q_{r \times n}) = r\)。
充分性:$ rank(B) + rank(C) - r \leq rank(BC) \leq rank(B) = r\(,显然\)rank(A) = rank(BC) =r$
$Exercise. $ 设\(B_1,B_2\)是数域\(K\)上的\(s \times r\)列满秩矩阵,证明:存在\(K\)上的s阶可逆矩阵\(P\),使得\(B_1 = PB_2\)
易知:存在s阶可逆矩阵使得\(P_1 B_1 = \begin{pmatrix} I_r \\ 0 \end{pmatrix}\),\(P_2 B_2 = \begin{pmatrix} I_r \\ 0 \end{pmatrix}\)
所以\(P_1 B_1=P_2 B_2 \ \rightarrow \ B_1= (P_1^{-1}P_2)B_2\),因此\(P=P_1^{-1}P_2\)为s阶可逆矩阵。
\(Exercise. \(设\)K\)上的\(A_{s \times n},B_{n \times m}\),证明:\(ABX_{m \times n} =A\)有解1的充分必要条件是:
因为矩阵方程\(ABX = A\)有解,则\(rank(AB) = rank(AB,A)\),说明$ rank(A) \leq rank(AB) \(,又因为\)rank(AB) \leq rank(A)\(,所以\)rank(AB) = rank(A)$
广义逆矩阵
对于线性方程组\(Ax=\beta\),若\(A\)不可逆但有解,需要引入广义逆矩阵\(A^{-}\)来简洁表示解。
$Def. 1 $ 设\(A\)是数域\(K\)上的\(s \times n\)非零矩阵,则
$$
AXA = A
$$
一定有解。每一个解都称为\(A\)的一个广义逆矩阵\(A^{-}\)。
因此,\(Ax=\beta\)有解时,它的通解为\(x = A^{-} \beta\)。
$Def. 2 $ 数域\(K\)上n元齐次线性方程组\(Ax=0\)的通解为:
其中\(A^{-}\)为\(A\)任意给定的广义逆,\(Z\)取遍\(K^n\)中的任意列向量。
结合上述两个定义,可知对于数域\(K\)上的非齐次线性方程组\(Ax=\beta\),它的通解为:
显然广义逆并不唯一
$Def. 3 $ Penrose方程组:设\(A\)是复数域上的\(s \times n\)矩阵,矩阵方程组:
得到的解为\(A\)的\(Moore-Penrose\)广义逆,记作\(A^{+}\)。其中\((AX)^*\)表示把\(AX\)的所有元素取共轭复数再转置得到的矩阵。
$Def. 4 $ 若\(A\)是复数域上的\(s \times n\)非零矩阵,则\(A\)的Penrose方程组始终有唯一解。设\(A=BC\),其中\(B\)是列满秩矩阵,\(C\)是行满秩矩阵,则唯一解为:
即对于任意的复矩阵\(A\),\(A\)的\(Moore-Penrose\)广义逆\(A^+\)存在且唯一。
$Exercise. $ 设\(B,C\)分别为复数域上的\(s \times r,\quad r \times n\)列满秩、行满秩矩阵,则:
上述已知
由于\(B=BI_r,C=I_r C\),所以
所以\(C^+ B^+ = C^* (C C^*)^{-1} (B^* B)^{-1} B^* = (BC)^+\)
$Exercise. $ 设\(A\)分别为复数域上的\(s \times n\)矩阵,证明:\(B\)是\(A\)的一个广义逆的充分必要条件是:
由上述可知,\(B\)是\(AXA = A\)的解,即\(ABA = A \ \rightarrow \ A(I_n - BA) = 0\)。因此\(rank(A) + rank(I_n - BA) = n\)。
$Exercise. $ 设\(A\)分别为数域上的\(s \times n\)非零矩阵,证明:$$rank(A^{-}A) = rank(A) $$
已知:
则:
易得\(rank(A^{-}A) = rank \begin{pmatrix} I_r & 0 \\ C & 0 \end{pmatrix} \geq r \(,又因为\)rank(A^{-}A) \leq rank(A) =r\),所以\(rank(A^{-}A) = rank(A) = r\)
$Exercise. $ 设\(A,B,C\)分别为数域上的\(s \times n,l \times m, s \times m\)非零矩阵,证明:存在广义逆\(A^{-},B^{-}\)使得:
假设\(rank(A)=r,rank(B)=t\),则:
取其中的\(G_1=0,H_2=0\):
假设\(P_1^{-1} C Q_2^{-1} = \begin{pmatrix} C_1 & C_2 \\ C_3 & C_4 \end{pmatrix}\),则:
即:\(rank[(I_s - AA^{-})C(I_m - B^{-}B)] = rank(C_4)\)
$$ \begin{aligned} &\begin{pmatrix} P_1^{-1} & 0 \ 0 & P_2^{-1} \end{pmatrix} \begin{pmatrix} A & C \ 0 & B \end{pmatrix} \begin{pmatrix} Q_1^{-1} & 0 \ 0 & Q_2^{-1} \end{pmatrix}= \begin{pmatrix} P_1{-1}AQ_1 & P_1{-1}CQ_2 \ 0 & P_2{-1}BQ_2 \} \ \end{pmatrix
&= \begin{pmatrix}
I_r & 0 & C_1 & C_2 \
0 & 0 & C_3 & C_4 \
0 & 0 & I_t & 0 \
0 & 0 & 0 & 0 \
\end{pmatrix}
= \begin{pmatrix}
I_r & 0 & 0 & 0 \
0 & 0 & I_t & 0 \
0 & 0 & 0 & C_4 \
0 & 0 & 0 & 0 \
\end{pmatrix}
\end{aligned}
$$
可知\(rank \begin{pmatrix} A & C \\ 0 & B \end{pmatrix} = rank(A) + rank(B) +rank(C_4) = rank(A) + rank(B) +rank[(I_s - AA^{-})C(I_m - B^{-}B)]\)
矩阵的相似
$Def. 1 $ 设\(A\)与\(B\)都是数域上的\(n\)阶矩阵,若存在数域上的\(n\)阶可逆矩阵\(P\),使得\(P^{-1}AP=B\),则称\(A\)与\(B\)相似,记作\(A \sim B\)。
-
相似矩阵的行列式的值相等:\(det(A) = det(B)\)
-
相似矩阵或可逆或不可逆,若可逆,则逆矩阵也相似
-
相似矩阵的秩相等:\(rank(A) = rank(B)\)
-
相似矩阵的迹相等:\(tr(A) = tr(B)\)
-
设\(f(x)=a_0+a_1x+...+a_m x^m\)是数域\(K\)上的一元多项式,若\(A \sim B\),则\(f(A) \sim f(B)\)
-
若\(A_i \sim B_i, \ i=1,2\),则\(\(\begin{pmatrix} A_1 & 0 \\ 0 & A_2 \end{pmatrix} \sim \begin{pmatrix} B_1 & 0 \\ 0 & B_2 \end{pmatrix}\)\)
-
若\(A\)可逆,则\(AB \sim BA\)。因为\(B = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} A^{-1} \ \rightarrow \ BA = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} \ \rightarrow \ P^{-1} (BA) P = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} = (AB) P\)
若n阶矩阵\(A\)能够相似于一个对角矩阵,则称为\(A\)可对角化,\(P^{-1}AP=diag\{ \lambda_1, \lambda_2, ...,\lambda_n \}\)
- 若\(A\)可对角化,则\(A \sim A^T\)
$Def. 2 $ 数域\(K\)上n阶矩阵\(A\)可对角化的充分必要条件:\(K^n\)中有n个线性无关的列向量\(\mathbf{a_1,a_2,...,a_n}\),以及\(K\)中的n个数\(\lambda_1, \lambda_2, ..., \lambda_n\),使得$$A \mathbf{a_i} = \lambda_i \mathbf{a_i}, \quad i=1,2,...,n $$
令\(P = (\mathbf{a_1,a_2,...,a_n})\),则\(\(P^{-1}AP = diag\{ \lambda_1, \lambda_2, ..., \lambda_n \}\)\)
特征值
$Def. 1 $ 设\(A\)是数域\(K\)上的n阶矩阵,若\(K^n\)中有非零列向量\(\mathbf{a}\)使得:
则称\(\lambda_0\)是矩阵\(A\)的一个特征值,\(\mathbf{a}\)是\(A\)对应于特征值\(\lambda_0\)的特征向量。
-
\(\lambda_0\)是\(A\)的一个特征值当且仅当\(\lambda_0\)是特征多项式\(|\lambda I - A|=0\)在\(K\)的一个根
-
\(\mathbf{a}\)是\(A\)的属于\(\lambda_0\)的一个特征向量当且仅当\(\mathbf{a}\)是齐次线性方程组\((\lambda_0 I - A) \mathbf{x} = \mathbf{0}\)的一个非零解
-
设\(A \sim B\),则\(|\lambda I -B|=|\lambda I -A|\)
-
相似矩阵具有相同的特征数(重数也相同)
-
对于齐次线性方程组\((\lambda_j I-A)x=0\)的一个基础解系:\(\eta_1,\eta_2,...,\eta_t\),则\(A\)属于\(\lambda_j\)的全部特征向量组成的集合为:
-
\(\lambda_1\)作为\(A\)的特征多项式的根的重数叫做\(\lambda_1\)的代数重数,把\(A\)的属于\(\lambda_1\)特征子空间的维数叫做\(\lambda_1\)的几何重数(几何重数不超过代数重数)
-
设\(f(x)=a_0+a_1 x+...+a_m x^m\)是数域\(K\)上的一个多项式。证明:若\(\lambda_0\)是\(K\)上n阶矩阵\(A\)的一个特征值,且\(\mathbf{a}\)是对应的一个特征向量。那么\(f(\lambda_0)\)是\(f(A)\)的一个特征值,且\(\mathbf{a}\)是\(f(A)\)的属于\(f(\lambda_0)\)的一个特征向量。
矩阵可对角化的条件
$Def. 1 $ 数域\(K\)上n阶矩阵\(A\)可对角化的充分必要条件为:\(A\)有n个线性无关的特征向量\(\mathbf{a_1,a_2,...,a_n}\),即:
则\(P^{-1} A P = diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\),其中\(\lambda_i\)是\(\mathbf{a_i}\)所属的特征值。这个对角矩阵\(diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\)是\(A\)的相似标准形。
若各组向量数之和\(r_1+r_2+...+r_m<n\),则\(A\)没有n个线性无关的特征向量,因此\(A\)不可对角化。(不同特征值对应的特征向量互相线性无关)
- 若数域\(K\)上的n阶矩阵\(A\)可对角化的充分必要条件:\(A\)的特征多项式的全部复根属于\(K\),且每个特征值的几何重数等于代数重数
实对称矩阵的对角化
坐标变换的实例:对于二次曲线在笛卡尔坐标系下的方程
通过直角坐标变换,消去方程中的交叉项,只留下平方项(\(\mathbf{T}\)是正交矩阵,\(T^{-1}=T^T\)):
代入后得到:
显然\(A\)是实数域上的对称矩阵(\(A=\bar{A}\)),为了使得方程只留下平方项,需要\(T^T A T(T^{-1}AT)\)为对角矩阵,即\(A\)可对角化。
若n阶实矩阵\(A,B\)存在一个n阶正交矩阵\(T\),使得\(T^{-1}AT=B\),则\(A\)正交相似于\(B\)
-
实对称矩阵的特征多项式的每一个复根都是实数,从而它们都是特征值
-
实对称矩阵\(A\)的属于不同特征值的特征向量是正交的\((\mathbf{a_1,a_2})=0\)
-
实对称矩阵一定正交相似于对角矩阵(\(T^{-1}AT=diag\{\lambda_1,\lambda_2,...,\lambda_n \}\))
-
n阶实矩阵\(A\)正交相似于一个对角矩阵\(D\),则\(A\)一定是对称矩阵,\(T^{-1}AT=D, \ A^T = (TDT^{-1})^T = TDT^{-1} = A\)
二次型
$Def. 1 $ 数域\(K\)上的一个n元二次型是系数在\(K\)中的n个变量的二次齐次多项式:
其中\(a_{ij}=a_{ji}, \ 1 \leq i,j \leq n\)
所有系数可排成一个n阶矩阵\(A\)。称为二次型\(f(x_1,...,x_n)\)的矩阵,显然\(A\)是对称且唯一的,主对角元是\(x_1^2,x^2_2,...,x^2_n\)的系数,\((i,j)\)元是\(x_i x_j\)的系数的一半:
因此二次型\(f(x_1,...,x_n)\)可以表示为:\(\(f(x_1,...,x_n) = X^T A X\)\)
令\(Y=\begin{pmatrix} y_1 \\ y_2 \\ ...\\ y_n \\ \end{pmatrix}\),设\(C\)是数域\(K\)上的n阶可逆矩阵,则存在:
称为变量\(x_1,x_2,...,x_n\)到\(y_1,...,y_n\)的非退化线性替换
记\(B=C^{T}AC\),则\(X^{T} A X = Y^{T} B Y\),\(B\)也是对称矩阵。
$Def .2 $ 对于数域\(K\)上的两个n元二次型\(X^{T} A X\)与\(Y^{T}BY\),若存在一个非退化线性替换\(X=CY\),使得\(X^{T}AX\)转换为\(Y^{T}BY\),那么两者等价,记作\(\(X^{T}AX \simeq Y^{T}BY\)\)。
$Def.3 $ 数域\(K\)上两个n阶矩阵\(A,B\),若存在\(K\)上一个n阶可逆矩阵\(C\),使得:
则称\(A\)与\(B\)合同,记作\(A \simeq B\)。
-
当两个n元二次型\(X^{T}AX,Y^{T}BY\)等价当且仅当n阶矩阵\(A,B\)合同
-
若二次型\(X^{T}AX\)等价于一个只含平方项的二次型,称为标准形
-
若对称矩阵\(A\)合同于一个对角矩阵,则称为合同标准形
对于n阶实对称矩阵\(A\),存在一个n阶正交矩阵\(T\),使得\(T^{-1}AT\)是对角矩阵\(diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\),其中\(\lambda_1,\lambda_2,...,\lambda_n\)是\(A\)的特征值。因为\(T^{-1} = T^T\),因此\(A\)合同于\(diag \{ \lambda_1,\lambda_2,...,\lambda_n \}\)。
因此,\(X=TY\)称为正交替换。
-
数域\(K\)上任一对称矩阵都合同于一个对角矩阵
-
数域\(K\)上任一n元二次型都等价于一个只含平方项的二次型。(方法:成对的初等行、列变换法)
-
数域\(K\)上n元二次型\(X^{T}AX\)的任一标准形中,系数不为0的平方项个数等于矩阵\(A\)的秩,\(rank(A)=r\)
$Exercise. $ 将二次曲面方程化作标准方程:
取二次项部分:\(f(x,y,z)=x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz\),二次型矩阵为:
通过特征值为5,5,-4,易得特征向量\(a_1,a_2,a_3\),通过施密特正交化和单位化得到\(\eta_1,\eta_2,\eta_3\)。因此,得到正交矩阵\(T\):
作正交替换,使得二次型\(f(x,y,z)\)化为标准形\(5{x'}^2 + 5{y'}^2-4{z'}^2\):
得到二次曲面的新方程:
作移轴:
则方程转变为:\(5 {x^*}^2 + 5 {y^*}^2 - 4{z^*}^2 = 1\)
因此,总的直角坐标变换公式为:
$Exercise. $ 设\(A\)是数域\(K\)上的n阶矩阵,证明:\(A\)是斜对称矩阵当且仅当对于\(K^n\)中任一列向量\(\mathbf{a}\),有\(\mathbf{a}^T A \mathbf{a} = 0\)
-
必要性:因为\(A\)是斜对称矩阵,所以\(A^T = -A\),因此\((\mathbf{a}^T A \mathbf{a})^T = \mathbf{a}^T A^T \mathbf{a} = -\mathbf{a}^T A \mathbf{a} = 0\),因此\(\mathbf{a}^T A \mathbf{a} = 0\)
-
充分性:设\(A\)的列向量\(\mathbf{a_1,a_2,...,a_n}\),已知\(\epsilon_i^T A \epsilon_i = \epsilon_i^T \mathbf{a_i} = a_{ii} = 0, \quad i=1,2,...,n\) ,\((\epsilon_i + \epsilon_j)^T A (\epsilon_i + \epsilon_j) = (\epsilon_i + \epsilon_j)^T (\mathbf{a_i} + \mathbf{a_j}) = a_{ii} + a_{ij} + a_{ji} + a_{jj} = a_{ij} + a_{ji}, \quad i \neq j\),因此是\(A\)斜对称矩阵
\(Exercise.\) 设n阶实对称矩阵\(A\)的全部特征值按大小顺序排成\(\lambda_1 \geq \lambda_2 \geq ... \geq \lambda_n\)。证明:对于\(R^n\)中任一非零列向量\(\mathbf{a}\),都有\(\(\lambda_n \leq \frac{\mathbf{a}^T A \mathbf{a}}{|\mathbf{a}|^2} \leq \lambda_1\)\)
因为\(A\)为n阶实对称矩阵,因此存在正交矩阵\(T\),使得\(T^{-1}AT = diag\{ \lambda_1,\lambda_2,...,\lambda_n \}\),设\(\mathbf{a}\)为一个\(R^n\)中的非零列向量,\((T \mathbf{a})^T = (b_1,b_2,...,b_n)\),因此:
显然,\(\lambda_n |\mathbf{a}|^2 \leq \mathbf{a}^T A \mathbf{a} \leq \lambda_1 (b_1^2 + b_2^2 + ... + b_n^2) = \lambda_1 |\mathbf{a}|^2\)
因此:\(\(\lambda_n \leq \frac{\mathbf{a}^T A \mathbf{a}}{|\mathbf{a}|^2} \leq \lambda_1\)\)
实二次型的规范形
实二次型\(X^T AX\)的规范形是:
规范形只含平方项,且系数为1,-1,0,系数为1的平方项写在前面,其中平方项的个数等于矩阵\(A\)的秩\(rank(A)\),
\(Def. 1 \ \(惯性定理:n元实二次型\)X^T AX\)的规范形是唯一的。
-
其中,系数为+1的平方项个数\(p\)称为二次型的正惯性指数,系数为-1的平方项个数\(r-p\)称为二次型的负惯性指数。正惯性指数减去负惯性指数的差\(2p-r\)称为\(X^TAX\)的符号差。
-
两个n元实二次型等价$ \leftrightarrow \(规范形相同\) \leftrightarrow $秩相等,且正惯性指数相等
-
若\(A\)合同于对角矩阵\(diag\{ 1,...,1,-1,...,-1,0,...,0 \}\)(1的个数等于正惯性指数,-1的个数等于负惯性指数),则其为\(A\)的合同规范形
-
两个n阶实对称矩阵合同$ \leftrightarrow $秩相等,正惯性指数相等
复二次型的规范形
设n元复二次型\(X^T AX\)通过一个非退化线性替换\(X=CY\)转换成标准形:
\(r\)即为二次型的秩,\(d_i \neq 0 , \ i=1,2,...,r\)。假设\(d_j=r_j (cos \theta_j + i \ sin\theta_j), \ 0 \leq \theta_j < 2 \pi\),易得:
因此将\(\sqrt{r_j} (cos \frac{\theta_j}{2} + i \ \frac{sin\theta_j}{2})\)记作\(\sqrt{d_jd_j}\),则再作非退化线性替换为:
因此\(X^T AX\)的标准形:
便是复二次型\(X^T AX\)的规范型,只含平方项,且系数为1或0。复二次型\(X^T AX\)的规范型完全由秩决定。
-
复二次型\(X^T AX\)的规范形是唯一的
-
两个n元复二次型等价$ \leftrightarrow \(规范形相同\) \leftrightarrow $秩相等
-
任一n阶复对称矩阵\(A\)合同于对角矩阵\(\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}\),其中\(r=rank(A)\)。
-
两个n阶复对称矩阵合同$ \leftrightarrow $秩相等
正定二次型
若对于\(R^n\)中任意非零列向量\(\mathbf{a}\),都由\(\mathbf{a}^T A \mathbf{a} > 0\),则称\(X^T AX\)为正定二次型。
-
n元实二次型\(X^T AX\)正定,当且仅当其正惯性指数等于n,其规范形为:$$y_12+y_22+...+y^2_n $$
-
n元实二次型\(X^T AX\)是正定的 $ \leftrightarrow $ \(A\)的正惯性指数等于n $ \leftrightarrow $ \(A\)合同于对角矩阵\(I_n\),即\(A \simeq I_n\) $ \leftrightarrow $ \(A\)的特征值全为正
-
与正定矩阵合同的实对称矩阵也是正定矩阵
-
非退化线性退化不会给改变实二次型的正定性
-
正定矩阵的行列式大于0,\(A=C^T I_n C,|A|=|C^T C| = |C|^2>0\)
$Def. 1 $ 若对于\(R^n\)中任一非零列向量\(\mathbf{a}\),都有:
则该n元实二次型\(X^T AX\)称为半正定(负定,半负定)。
- n元实二次型\(X^T AX\)是半正定\(\ \leftrightarrow \$正惯性指数等于秩\) \leftrightarrow $规范形为\(y_1^2+...+y_r^2\) $ \leftrightarrow $标准形中n个系数均非负
$Def. 2 $ 黑塞(Hesse)矩阵:设二元实值函数\(F(x,y)\)有一个稳定点\(\mathbf{a}=(x_0,y_0)\),即在该点的一阶偏导数全为0,设\(F(x,y)\)在\((x_0,y_0)\)的一个邻域里有3阶连续偏导数,令:
称\(\mathbf{H}\)为\(F(x,y)\)在\((x_0,y_0)\)处的黑塞矩阵。若黑塞矩阵\(\mathbf{H}\)正定,则\(F(x,y)\)在\((x_0,y_0)\)处具有极小值。若负定,则\(F(x,y)\)在\((x_0,y_0)\)处具有极大值。
将\(F(x,y)\)在\((x_0,y_0)\)处展开为Talyor级数,得:
设\(a=F''_{xx}(x_0,y_0),b=F''_{xy}(x_0,y_0),c=F''_{yy}(x_0,y_0)\),则:
是\(h,k\)的实二次型,其矩阵就是\(\mathbf{H}\)。若正定,则对于足够小的\(|h|,|k| \neq 0\),有
表明\(F(x,y)\)在\((x_0,y_0)\)处具有极小值。负定的情况相反,达到极大值。
推广到n元形式,设\(F(x_1,x_2,...,x_n)\)在\(\mathbf{a}=(a_1,a_2,...,a_n)\)处有连续的3阶偏导数,则黑塞矩阵\(\mathbf{H}=(F''_{x_i x_j}(\mathbf{a}))\)。