Higher Algebra: 矩阵

矩阵的性质

矩阵的逆：设$A$为n阶方阵，若存在n阶方阵$B$，使得$AB=BA=I_n$，则称$A$可逆，$B$为$A$的逆矩阵，记为$A^{-1}$。

若矩阵没有逆，则称矩阵为奇异阵，反之则称矩阵为非异阵或可逆阵。可逆矩阵经初等变换后仍是可逆矩阵，奇异阵经初等变换后仍是奇异阵。

设$A$是一个n阶可逆矩阵，则通过有限次的初等变换$P_m...P_1 A$就可以转化为单位矩阵$I_n$。（$A = P_1^{-1}...P_m^{-1}$）

矩阵的相抵：若一矩阵$A$经过有限次初等变换后变成$B$,则称$A$与$B$是等价的，或$A$与$B$相抵，记为$A\sim B$.

对于任一矩阵$A_{m \times n} = (a_{ij})_{m \times n}$必相抵于下列$m \times n$矩阵：

\[ B = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} \]

即$A \sim B$，任一$m \times n$矩阵均与一个主对角线上元素等于1或0而而其余元素均为0的$m \times n$矩阵相抵。

易得：对任意一个秩为$r$的$m \times n$矩阵$A$，总存在$m$阶可逆阵$P$和$n$阶可逆阵$Q$，使得：

\[ PAQ = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} \]

关于矩阵的秩：

任意矩阵$A$的转置$A^T$与$A$具有相同的秩，即$rank(A) = rank(A^T)$
任意矩阵与可逆阵相乘，其秩不变
$n$阶方阵$A$为可逆阵的充分必要条件为$A$为满秩阵（$rank(A) = n$）
两个$m \times n$矩阵等价的充分必要条件为它们具有相同的秩，即$rank(A_{m \times n}) = rank(B_{m \times n})$
对于给$A_{m \times n}$与$B_{n \times s}$，有$\(r(A) + r(B) -n \leq rank(AB) \leq min \{ r(A), r(B) \}$\) 证明Sylvester不等式：$\(\begin{pmatrix} I_n & 0 \\ 0 & AB \end{pmatrix} \sim \begin{pmatrix} I_n & 0 \\ A & AB \end{pmatrix} \sim \begin{pmatrix} I_n & A \\ -B & 0 \end{pmatrix} \sim \begin{pmatrix} -B & I_n \\ 0 & A \end{pmatrix}$\) 因此$r(A) + r(B) -n \leq rank(AB)$显然成立。

矩阵分块

设矩阵$A_{s \times} n$与$B_{n \times m}$，$C_{s \times m}$，则$B$的列向量组为$\beta_1,\beta_2,...,\beta_m$，则$AB=A(\beta_1,\beta_2,...,\beta_m)=(A\beta_1,A\beta_2,...,A\beta_m)$。$C$的列向量组$\delta_1,\delta_2,...,\delta_m$。

对于$AB=C$可以看作$(A\beta_1,A\beta_2,...,A\beta_m)=(\delta_1,\delta_2,...,\delta_m) \ \rightarrow \ A \beta_j = \delta_j \ (j=1,2,...,m)$，即$\beta_j$是$Ax=\delta_j$的一个解。

$Exercise. $ 证明：设$A_{s \times n},B_{n \times m}$，若$AB=0$，证明：$rank(A)+rank(B) \leq n$。

$B$的列向量组为$\beta_1,\beta_2,...,\beta_m$。显然$\beta_j$属于$Ax=0$的解空间$W$，则$rank(B) = dim<\beta_1,\beta_2,...,\beta_m> \leq dim \ W = n - rank(A)$。即为$rank(A)+rank(B) \leq n$

n维向量空间

$Def.1 $ 定义数域$K$上所有$n$元有序数组组成的几何$K^n = \{ (a_1,a_2,...,a_n) | a_i \in K, \ i=1,2,...,n \}$，连同定义在其上面的加法运算和数乘运算，及其满足的运算法则，称为数域$K$上的一个$n$维向量空间。

$Def.2 $ 若$K^n$的一个非空子集$U$满足：（1）$\mathbf{\alpha,\gamma} \in U \ \rightarrow \ \mathbf{\alpha + \gamma} \in U$ ；（2）$\mathbf{\alpha} \in U, \ k \in K \ \rightarrow \ k\mathbf{\alpha} \in U$，则称$U$为$K^n$的一个线性子空间（加法封闭、数乘封闭）。

$Exercise. \ \(假设$\mathbf{a_1,...,a_s}\)线性无关，有：

\[ \begin{aligned} \mathbf{b_1} =& a_{11} \mathbf{a_1} + ... + a_{1s} \mathbf{a_s} \\ ...& \\ \mathbf{b_s} =& a_{s1} \mathbf{a_1} + ... + a_{1s} \mathbf{a_s} \\ \end{aligned} \]

证明：$\mathbf{b_1},...,\mathbf{b_s}$线性无关的充分必要条件是：$\(\begin{vmatrix} a_{11} & ... & a_{s1} \\ ... & & ... \\ a_{1s} & ... & a_{ss} \end{vmatrix} \neq 0$\)

设$k_1 \mathbf{b_1} + ... + k_s \mathbf{b_s} = 0$，即为$(k_1 a_{11}+...+k_s a_{s1}) \mathbf{a_1} + ...+ (k_1 a_{1s}+...+k_s a_{ss}) \mathbf{a_s} = 0$。已知$\mathbf{a_1,...,a_s}$线性无关：

\[ \begin{cases} k_1 a_{11}+...+k_s a_{s1} =0\\ ... \\ k_1 a_{1s}+...+k_s a_{ss} =0\\ \end{cases} \ \rightarrow \ |A| = \begin{vmatrix} a_{11} & ... & a_{s1} \\ ... & & ... \\ a_{1s} & ... & a_{ss} \end{vmatrix} \]

若$|A| \neq 0$，则以上齐次线性方程只有零解，$k_1=0,...k_s=0$，$\mathbf{b_1},...,\mathbf{b_s}$线性无关

$Def.3 $向量组的极大线性无关组所含的向量个数称为这个向量组的秩。

若向量组$\mathbf{a_1,...,a_s}$可以由向量组$\mathbf{b_1,...,b_s}$线性表出，则$rank(\mathbf{a_1,...,a_s}) \leq rank(\mathbf{b_1,...,b_s})$。等价的向量组有相同的秩，但秩相同的向量组不一定等价（除非满秩）。因此，两个向量组等价的充分必要条件是：秩相同且其中一个向量组能由另一个向量组线性标出。

$Def.4 \ \(设$U\)是$K^n$的一个子空间，若线性无关的向量组$\mathbf{a_1,...,a_s} \in U$，且$U$的每个向量都可由$\mathbf{a_1,...,a_s}$线性表出，则称$\mathbf{a_1,...,a_s}$为$U$的一个基。基所含的向量个数为$U$的维数，记作$dim_K(U) = s$。（显然$dimK^N = n$）

若$U$与$W$均为$K^n$的非零子空间，且$U \subseteq W \(，那么$U\)的基$\mathbf{a_1,...,a_r}$可由$W$的基$\mathbf{\eta_1,...,\eta_t}$线性表出，$r \leq t$，因此$dim \ U \leq dim \ W$

$Def.5 $ 数域$K$上n元齐次线性方程组$AX=0$的解空间$W$的维数$dim \ W = n - rank(A)$

证明；因为$rank(A) = r$，则$AX=0$可写成如下：

\[ \begin{cases} x_1= -b_{1,r+1} x_{r+1} - ... - b_{1,n} x_n \\ x_2= -b_{2,r+1} x_{r+1} - ... - b_{2,n} x_n \\ ... \\ x_r = -b_{r,r+1} x_{r+1} - ... - b_{r,n} x_n \\ x_{r+1} = 1 x_{r+1} + ... + 0 x_n \\ ... \\ x_n = 0 x_{r+1} + ... + 1 x_n\\ \end{cases} \]

可得线性无关的n-r个解$\mathbf{\eta_1,...,\eta_{n-r}}$，即：

\[ \mathbf{\eta_1} = \begin{pmatrix} -b_{1,r+1} \\ ... \\ -b_{r,r+1} \\ 1 \\ 0 \\ ... \\ 0 \end{pmatrix},...,\mathbf{\eta_{n-r}} = \begin{pmatrix} -b_{1,r+1} \\ ... \\ -b_{r,r+1} \\ 0 \\ 0 \\ ... \\ 1 \end{pmatrix} \]

取其中一个解$\mathbf{\eta} = (c_1,...,c_n)^T$，则：

$$ \begin{aligned}

\mathbf{\eta} =& \begin{pmatrix} c_1 \ ... \ c_r \ c_{r+1} \ ... \ c_n \end{pmatrix} = \begin{pmatrix} -b_{1,r+1} c_{r+1}& -& ...& -& b_{1,n} c_{n}& \ ... \ -b_{r,r+1} c_{r+1}& -& ...& -& b_{r,n} c_{n}& \ 1 c_{r+1}& +& ...& -& 0 c_{n}& \ ... \ 0 c_{r+1}& +& ...& -& 1 c_{n}& \ \end{pmatrix} \

=& c_{r+1} \mathbf{\eta}1 +...+ c \end{aligned} $$} \mathbf{\eta}_{n-r

显然每一个解都可由$\mathbf{\eta_1,...,\eta_{n-r}}$线性表出(基础解系)，所以$\mathbf{\eta_1,...,\eta_{n-r}}$是$W$的一个基，$dim \ W = n-rank(A)$

$Exercise. $ 设$A$是数域$K$上$s \times n$矩阵，证明：若对于$K^n$中任意一列向量$\mathbf{\eta}$，都有$A \mathbf{\eta}=0$，则$A = 0$。

即$K^n$中任意一列向量$\mathbf{\eta}$都是$AX=0$的解。解空间$W=K^n$，可知$dim \ W = n - rank(A) = n$，所以$rank(A) = 0$，$A=0$。

正交矩阵

$Def.1 \ \(实数域上的n阶矩阵$A\)满足$A^T A =I_n$，则$A$为正交矩阵。若$A$可逆，则$A^{-1} = A^T，AA^{-1}=I_n$。

正交矩阵$A$的$A^T（A^{-1}$也是正交矩阵
正交矩阵的行列式$|A| = \pm 1$，因为$det(A^T A) = det(I_n) = 1$，所以$det(A)^2 = 1$，$det(A) = \pm 1$。
若$A$与$B$为正交矩阵，那么$AB$也是正交矩阵，因为$(AB)^T AB = A^T B^T AB = A^T I_n B = I_n$。
对于实数域上的n阶矩阵$A$的行向量组$\mathbf{\gamma_1,...,\gamma_n}$，行列向量组$\mathbf{a_1,...,a_n}$。满足：$$\gamma_i \gamma_j^T = \delta^j_i, a_i a_j^T = \delta^j_i, 1 \leq i,j \leq n $$

$Def. 2 $ 在$R^n$中任取$\mathbf{a},\mathbf{b} \in R^n$，规定：$(\mathbf{a}, \mathbf{b})=\mathbf{a} \cdot \mathbf{b} = \mathbf{a}^T \mathbf{b} = \sum_{i=1}^n a_i b_i$。则称$(\mathbf{a}, \mathbf{b})$为$R^n$的一个标准内积（内积）。在n维向量空间$R^n$有了标准内积后，则$R^n$成为欧几里得空间。

若非零向量组中的向量两两正交，则称为正交向量组，且该向量组一定线性无关。若在欧几里得空间$R^n$中，n个向量组成的正交向量组一定是$R^n$的基（正交基）。n个单位向量组成的正交向量组为$R^n$的标准正交基。

$Def. 3 $ 施密特正交化：假设$\mathbf{a_1,a_2,...,a_s}$为欧几里得空间$R^n$中的一个线性无关向量组，则：

\[ \begin{cases} \mathbf{\beta_1} = \mathbf{\alpha_1} \\ \mathbf{\beta_2} = \mathbf{\alpha_2} - \frac{(\mathbf{\alpha_2} ,\mathbf{\beta_1})}{(\mathbf{\beta_1},\mathbf{\beta_1})} \mathbf{\beta_1} \\ ...\\ \mathbf{\beta_s} = \mathbf{\alpha_s} - \sum_{j=1}^{s-1} \frac{(\mathbf{\alpha_s} ,\mathbf{\beta_j})}{(\mathbf{\beta_j},\mathbf{\beta_j})} \mathbf{\beta_j} \\ \end{cases} \]

通过施密特正交化方法，将线性无关向量组$(\mathbf{a_1,...,a_s})$正交化，得到正交向量组$(\mathbf{\beta_1,...,\beta_s})$。

$Exercise. \ \(设$A\)是实数域上的n阶可逆矩阵，则$A$可以唯一分解为正交矩阵$T$与主对角元都为正数的上三角矩阵$B$之积:$A = TB$

证明：设可逆阵$A$的行向量组为$\mathbf{a_1,...,a_n}$，则$\mathbf{a_1,...,a_n}$线性无关，且$\mathbf{a_1,...,a_n}$是$R^n$的标准正交基。设$\mathbf{a_1,...,a_n}$对应的正交向量组为$\mathbf{\beta_1,...,\beta_n}$，根据施密特正交化，设$b_{ji} = \frac{(\mathbf{a_j},\mathbf{\beta_i})}{(\mathbf{\beta_i},\mathbf{\beta_i})}, \ i=2,3,...,n; \ j=1,2,...,i-1$，则：

\[ \begin{aligned} A &= (\mathbf{a_1,...,a_n}) = (\mathbf{\beta_1},\mathbf{\beta_2},...,\mathbf{\beta_n}) \begin{pmatrix} 1 & b_{12} & b_{13} & ... & b_{1n} \\ 0 & 1 & b_{23} & ... & b_{2n} \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & 1 \end{pmatrix} \\ &= (\mathbf{\eta_1},\mathbf{\eta_2},...,\mathbf{\eta_n}) \begin{pmatrix} |\beta_1| & 0 & ... & 0 \\ 0 & |\beta_2| & ... & 0 \\ ... \\ 0 & 0 & ... & |\beta_n| \end{pmatrix} \begin{pmatrix} 1 & b_{12} & b_{13} & ... & b_{1n} \\ 0 & 1 & b_{23} & ... & b_{2n} \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & 1 \end{pmatrix} \\ &= (\mathbf{\eta_1},\mathbf{\eta_2},...,\mathbf{\eta_n}) \begin{pmatrix} |\beta_1| & b_{12}|\beta_1| & b_{13}|\beta_1| & ... & b_{1n}|\beta_1| \\ 0 & |\beta_2| & b_{23}|\beta_2| & ... & b_{2n}|\beta_2| \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & |\beta_n| \end{pmatrix} \\ &= TB \\ \end{aligned} \]

唯一性：$TB = T_1 B_1 \ \rightarrow \ T_1^{-1} T = B_1 B^{-1}$。显然$T_1^{-1}T$即为正交矩阵，也是上三角矩阵，易得其$a^2_{kk}=1, \ k=1,2,...,n$，即为单位矩阵，所以$B_1 B^{-1} = I_n$，$B_1 = B，T_1 =T$。

上述即为方阵的QR分解，我们可以将其推广到非方阵，设$A$是实数域上的$m \times n$矩阵（$m>n$），则$A$可以唯一分解为列向量为正交单位向量组的$Q_{m \times n}$与主对角元均为正数的$n$阶上三角矩阵$R$之积:$A = QR$。

\[ A = (\mathbf{\eta_1},\mathbf{\eta_2},...,\mathbf{\eta_n}) \begin{pmatrix} |\beta_1| & b_{12}|\beta_1| & b_{13}|\beta_1| & ... & b_{1n}|\beta_1| \\ 0 & |\beta_2| & b_{23}|\beta_2| & ... & b_{2n}|\beta_2| \\ ... & ... & ... & ... & ... \\ 0 & 0 & 0 & ... & |\beta_n| \end{pmatrix} \]

$Def. 4 $ 假设$U$为欧几里得空间$R^n$的一个子空间，若向量$\alpha$与$U$中每一个向量正交，即$\alpha \perp U$。令$U^\perp = \{ \mathbf{\alpha} \in R^n | \mathbf{\alpha} \perp U \}$，则$U^\perp$为$R^n$的一个子空间，称为$U$的正交补。

$Def. 5 $ 设$U$为欧几里得空间$R^n$的一个子空间，令

\[ P_U : R^n \rightarrow R^n, \ \mathbf{a} \rightarrow \mathbf{a_1} \]

其中$\mathbf{a_1} \in U$，且$\mathbf{a} - \mathbf{a_1} \in U^{\perp}$，则称$P_U$为$U$的正交投影。$\mathbf{a_1}$称为向量$\mathbf{a}$在$U$上的正交投影。对于$\mathbf{a} \in R^n$，有

\[ |\mathbf{a} - \mathbf{a_1}| \leq |\mathbf{a} - \mathbf{\gamma}|, \ \forall \mathbf{\gamma} \in U \]

$Exercise.1 $ 设$A$是实数域上的$m \times n$矩阵（$m>n$），$\beta \in R^n$。若有$x_0 \in R^n$使得$|Ax_0 - \beta|^2 \leq |Ax - \beta|, \ \forall x \in R^n$，则$x_0$为线性方程$Ax=\beta$的最小二乘解，证明：$x_0$是线性方程$Ax=\beta$的最小二乘解当且仅当$x_0$是$A^T Ax =A^T \beta$的解

设$U=<a_1,a_2,...,a_n>$表示$A$的列空间，则

即$Ax_0$为$\beta$在子空间$U$上的正交投影，所以$a_i^T (Ax_0 - \beta) = 0, \ i=1,2,...,n$。易得$A^T(Ax_0 - \beta) = \mathbf{0} \ \rightarrow \ A^T A x_0 = A^T \beta$，即$x_0$是$A^T Ax =A^T \beta$的解

$Exercise.2 $ 设$A$是实数域上的列满秩$m \times n$矩阵（$m>n$），其列空间记作$U = <a_1,a_2,...,a_n> \subset R^m$。证明$P_A=A(A^TA)^{-1}A^T$为$R^m$在$U$上的正交投影

任取$X \in R^m$，由于$((A^TA)^{-1}A^T) X$为$n \times 1$矩阵，可设为$(c_1,c_2,...,c_n)^T$，则:

\[ P_A X = (\mathbf{a_1,a_2,...,a_n}) \begin{pmatrix} c_1\\ c_2 \\ ... \\c_n \end{pmatrix} = c_1\mathbf{a_1} + c_2\mathbf{a_2} + ... + c_n\mathbf{a_n} \in U \]

再证$X - P_A X = (I_n - P_A)X \in U^{\perp} \subseteq R^m$，即

\[ \begin{pmatrix} \mathbf{a_1}\\ \mathbf{a_2} \\ ... \\ \mathbf{a_n} \end{pmatrix}(I_n - P_A)X = [A^T - A^TA(A^TA)^{-1}A^T]X = \mathbf{0} \]

因此$(I_n - P_A)X \in U^{\perp}$，综上$P_A=A(A^TA)^{-1}A^T$是$R^m$在$U$上的正交投影。

$Def. 5 $ 若存在一个对应法则$f$，使得集合$S$中的每一个元素$a$，都有$S'$中唯一确定的元素$b$与之对应，则称$f$为$S$到$S'$的映射，记作$f: S \rightarrow S'$，$a \rightarrow b$。$b$称为$a$在$f$下的象，$a$称为$b$在$f$下的一个原象。

映射$f$可记作:

\[ f(a) = b, \ a \in S \]

$S$为映射$f$的定义域，$S'$为映射$f$的陪域，$S$的所有元素在$f$下的象组成的集合为$f$的值域或$f$的象，即$f(S)$或$Im f$：

\[ f(S) = \{ f(a) \ | \ a \in S \} = \{ b \in S' \ | \ \exist a \in S,f(a)=b \} \]

显然$f$的值域是$f$的陪域的子集。

若$f(S) = S'$，则$f$为满射，$f$的陪域中的每个元素至少有一个原象
若对于$a_1,a_2 \in S$，有$f(a_1)=f(a_2) \ \rightarrow \ a_1=a_2$，则$f$为单射，$f$的定义域中的不同元素的象不同
若$f$既是单射又是满射，则$f$为双射，$f$的$S$与$S'$一一对应
集合$S$到数集的一个映射，称为$S$上的一个函数
陪域$S'$中的元素$b$在映射$f$下的所有原象组成的集合称为$b$在$f$下的原象集，记作$f^{-1}(b)$

$Def. 6 $ 映射$g:S \rightarrow S'$和$f:S' \rightarrow S''$得到$S \rightarrow S''$的一个映射$fg$，称为$f$与$g$的乘积/合成：

\[ (fg)(a) = f(g(a)), \ \forall a \in S \]

$Def. 7 $ 设$f:S \rightarrow S'$，存在一个$g:S’ \rightarrow S$，使得$$ fg = 1_{S} \quad gf=1_{S'}$\(，则称映射$f\)是可逆的，$g$为$f$的一个唯一逆映射,可记作$f^{-1}$。

映射$f:S \rightarrow S'$可逆的充分必要条件为$f$是双射

$Def. 8 $ 数域$K$上的向量空间$K^n \rightarrow K^s$的一个映射$\sigma$若保持加法和数乘运算，即$\forall \mathbf{a,b} \in K^n, \ k \in K$:

\[ \sigma(\mathbf{a+b}) = \sigma(\mathbf{a}) + \sigma(\mathbf{b}), \ \sigma(k\mathbf{a}) = k\sigma(\mathbf{a}) \]

则$\sigma$为$K^n$到$K^s$的一个线性映射。显然矩阵$A$是一个线性映射。

假设数域$K$上n元线性方程组$Ax=\beta$有解，即存在$\gamma \in K^n$使得$A \gamma = \beta$。根据线性映射的概念，$\beta \in Im \ A$

显然$\beta \in <\mathbf{a_1,a_2,...,a_n}>$，因此$Im \ A = <\mathbf{a_1,a_2,...,a_n}>$，即线性映射$A$的象等于$A$的列空间，因此$Im \ A$是$K^s$的一个子空间。

$Def. 9 $ 设$sigma$是$K^n \rightarrow K^s$的一个映射，$K^n$的一个子集$\(\{ \alpha \in K^n \ | \ \sigma(\alpha) = 0 \}$\)称为映射$\sigma$的核，记作$ Ker \sigma$。

如果$\sigma$是$K^n \rightarrow K^s$的一个线性映射，则$Ker \ \sigma$是$K^n$的一个子空间。

对于齐次线性方程组$Ax=0$，线性映射$A$的核就是方程组的解空间：$Ker \ A = W$

由于上述$dim \ W = n - rank(A) = n - dim<a_1,a_2,...,a_n>$，即秩-零化度定理$dim \ Ker \ A + dim \ Im \ A = dim \ K^n$

矩阵的相抵与相似

$Def. 1 $ 设数域$K$上$s \times n$矩阵$A$的秩为$r>0$，则$A$相抵于矩阵$\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}$，称为$A$的相抵标准型。

$Def. 2 $ 数域$K$上矩阵$A$与$B$相抵当且仅当秩相等，$rank(A) = rank(B)$

因此，存在$K$上的s阶，n阶可逆矩阵$P,Q$使得：

\[ A = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q \]

$Exercise. $ 设$A$为数域$K$上的$s \times n$矩阵，证明:$rank(A)$当且仅当存在$s \times r$列满秩矩阵$B$与$r \times n$行满秩矩阵$C$，使得$A=BC$

必要性：

\[ \begin{aligned} A =& P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q \\ =& (P_{s \times r}, \ P_{s \times (s-r)}) \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} Q_{r \times n} \\ Q_{(n-r) \times n} \end{pmatrix} \\ =& (P_{s \times r}, 0) \begin{pmatrix} Q_{r \times n} \\ Q_{(n-r) \times n} \end{pmatrix} = P_{s \times r} Q_{r \times n} = BC \end{aligned} \]

由于$P,Q$可逆，因此$rank(P_{s \times r})=rank(Q_{r \times n}) = r$。

充分性：$ rank(B) + rank(C) - r \leq rank(BC) \leq rank(B) = r$，显然$rank(A) = rank(BC) =r$

$Exercise. $ 设$B_1,B_2$是数域$K$上的$s \times r$列满秩矩阵，证明：存在$K$上的s阶可逆矩阵$P$，使得$B_1 = PB_2$

易知:存在s阶可逆矩阵使得$P_1 B_1 = \begin{pmatrix} I_r \\ 0 \end{pmatrix}$，$P_2 B_2 = \begin{pmatrix} I_r \\ 0 \end{pmatrix}$

所以$P_1 B_1=P_2 B_2 \ \rightarrow \ B_1= (P_1^{-1}P_2)B_2$，因此$P=P_1^{-1}P_2$为s阶可逆矩阵。

$Exercise. \(设$K\)上的$A_{s \times n}，B_{n \times m}$，证明：$ABX_{m \times n} =A$有解1的充分必要条件是：

\[ rank(AB) = rank(A) \]

因为矩阵方程$ABX = A$有解，则$rank(AB) = rank(AB,A)$，说明$ rank(A) \leq rank(AB) $，又因为$rank(AB) \leq rank(A)$，所以$rank(AB) = rank(A)$

广义逆矩阵

对于线性方程组$Ax=\beta$，若$A$不可逆但有解，需要引入广义逆矩阵$A^{-}$来简洁表示解。

$Def. 1 $ 设$A$是数域$K$上的$s \times n$非零矩阵，则

$$

AXA = A

$$

一定有解。每一个解都称为$A$的一个广义逆矩阵$A^{-}$。

因此，$Ax=\beta$有解时，它的通解为$x = A^{-} \beta$。

$Def. 2 $ 数域$K$上n元齐次线性方程组$Ax=0$的通解为：

\[ x = (I_n - A^{-}A)Z \]

其中$A^{-}$为$A$任意给定的广义逆，$Z$取遍$K^n$中的任意列向量。

结合上述两个定义，可知对于数域$K$上的非齐次线性方程组$Ax=\beta$，它的通解为：

\[ x = A^{-} \beta + (I_n - A^{-}A)Z \]

显然广义逆并不唯一

$Def. 3 $ Penrose方程组：设$A$是复数域上的$s \times n$矩阵，矩阵方程组：

\[ \begin{cases} AXA = A \\ XAX = X \\ (AX)^* = AX \\ (XA)^* = XA \end{cases} \]

得到的解为$A$的$Moore-Penrose$广义逆，记作$A^{+}$。其中$(AX)^*$表示把$AX$的所有元素取共轭复数再转置得到的矩阵。

$Def. 4 $ 若$A$是复数域上的$s \times n$非零矩阵，则$A$的Penrose方程组始终有唯一解。设$A=BC$，其中$B$是列满秩矩阵，$C$是行满秩矩阵，则唯一解为：

\[ X = C^*(CC^*)^{-1} (B^*B)^{-1}B^* \]

即对于任意的复矩阵$A$，$A$的$Moore-Penrose$广义逆$A^+$存在且唯一。

$Exercise. $ 设$B,C$分别为复数域上的$s \times r,\quad r \times n$列满秩、行满秩矩阵，则：

\[ (BC)^+ = C^+ B^+ \]

上述已知

\[ A^+ = (BC)^+ = C^*(CC^*)^{-1} (B^*B)^{-1}B^* \]

由于$B=BI_r，C=I_r C$，所以

\[ \begin{aligned} B^+ = I^*_r (I_r I_r^*)^{-1} (B^* B)^{-1} B^* = (B^* B)^{-1} B^* \\ C^+ = C^* (C C^*)^{-1} \\ \end{aligned} \]

所以$C^+ B^+ = C^* (C C^*)^{-1} (B^* B)^{-1} B^* = (BC)^+$

$Exercise. $ 设$A$分别为复数域上的$s \times n$矩阵，证明：$B$是$A$的一个广义逆的充分必要条件是：

\[ rank(A) + rank(I_n - BA) = n \]

由上述可知，$B$是$AXA = A$的解，即$ABA = A \ \rightarrow \ A(I_n - BA) = 0$。因此$rank(A) + rank(I_n - BA) = n$。

$Exercise. $ 设$A$分别为数域上的$s \times n$非零矩阵，证明：$$rank(A^{-}A) = rank(A) $$

已知：

\[ A = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q, \quad A^{-} = Q^{-1} \begin{pmatrix} I_r & B \\ C & D \end{pmatrix} P^{-1} \]

则：

\[ A^{-}A = Q^{-1} \begin{pmatrix} I_r & B \\ C & D \end{pmatrix} P^{-1} P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} Q = Q^{-1} \begin{pmatrix} I_r & 0 \\ C & 0 \end{pmatrix} Q \]

易得$rank(A^{-}A) = rank \begin{pmatrix} I_r & 0 \\ C & 0 \end{pmatrix} \geq r \(，又因为$rank(A^{-}A) \leq rank(A) =r\)，所以$rank(A^{-}A) = rank(A) = r$

$Exercise. $ 设$A,B,C$分别为数域上的$s \times n,l \times m, s \times m$非零矩阵，证明：存在广义逆$A^{-},B^{-}$使得：

\[ rank \begin{pmatrix} A & C \\ 0 & B \end{pmatrix} = rank(A) + rank(B) +rank[(I_s - AA^{-})C(I_m - B^{-}B)] \]

假设$rank(A)=r,rank(B)=t$，则：

\[ A^{-} = Q^{-1}_1 \begin{pmatrix} I_r & G_1 \\ H_1 & D_1 \end{pmatrix} P_1^{-1}, \quad B^{-} = Q^{-2}_2 \begin{pmatrix} I_t & G_2 \\ H_2 & D_2 \end{pmatrix} P_2^{-1} \]

取其中的$G_1=0,H_2=0$:

\[ AA^{-} = P_1 \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1}_1, \quad B^{-}B = Q^{-1}_2 \begin{pmatrix} I_t & 0 \\ 0 & 0 \end{pmatrix} Q_2 \]

\[ (I_s - AA^{-})C(I_m - B^{-}B) = P_1 \begin{pmatrix} 0 & 0 \\ 0 & I_{s-r} \end{pmatrix} P_1^{-1} C Q_2^{-1} \begin{pmatrix} 0 & 0 \\ 0 & I_{m-t} \end{pmatrix} Q_2 \]

假设$P_1^{-1} C Q_2^{-1} = \begin{pmatrix} C_1 & C_2 \\ C_3 & C_4 \end{pmatrix}$，则:

\[ (I_s - AA^{-})C(I_m - B^{-}B) = P_1 \begin{pmatrix} 0 & 0 \\ 0 & C_4 \end{pmatrix} Q_2 \]

即：$rank[(I_s - AA^{-})C(I_m - B^{-}B)] = rank(C_4)$

$$ \begin{aligned} &\begin{pmatrix} P_1^{-1} & 0 \ 0 & P_2^{-1} \end{pmatrix} \begin{pmatrix} A & C \ 0 & B \end{pmatrix} \begin{pmatrix} Q_1^{-1} & 0 \ 0 & Q_2^{-1} \end{pmatrix}= \begin{pmatrix} P_1^{-1}AQ_1 & P_1^{-1}CQ_2 \ 0 & P_2^{-1}BQ_2 \} \ \end{pmatrix

&= \begin{pmatrix} I_r & 0 & C_1 & C_2 \
0 & 0 & C_3 & C_4 \ 0 & 0 & I_t & 0 \ 0 & 0 & 0 & 0 \ \end{pmatrix}

= \begin{pmatrix} I_r & 0 & 0 & 0 \
0 & 0 & I_t & 0 \ 0 & 0 & 0 & C_4 \ 0 & 0 & 0 & 0 \ \end{pmatrix} \end{aligned} $$

可知$rank \begin{pmatrix} A & C \\ 0 & B \end{pmatrix} = rank(A) + rank(B) +rank(C_4) = rank(A) + rank(B) +rank[(I_s - AA^{-})C(I_m - B^{-}B)]$

矩阵的相似

$Def. 1 $ 设$A$与$B$都是数域上的$n$阶矩阵，若存在数域上的$n$阶可逆矩阵$P$，使得$P^{-1}AP=B$，则称$A$与$B$相似，记作$A \sim B$。

相似矩阵的行列式的值相等：$det(A) = det(B)$
相似矩阵或可逆或不可逆，若可逆，则逆矩阵也相似
相似矩阵的秩相等：$rank(A) = rank(B)$
相似矩阵的迹相等：$tr(A) = tr(B)$
设$f(x)=a_0+a_1x+...+a_m x^m$是数域$K$上的一元多项式，若$A \sim B$，则$f(A) \sim f(B)$
若$A_i \sim B_i, \ i=1,2$，则$\(\begin{pmatrix} A_1 & 0 \\ 0 & A_2 \end{pmatrix} \sim \begin{pmatrix} B_1 & 0 \\ 0 & B_2 \end{pmatrix}$\)
若$A$可逆，则$AB \sim BA$。因为$B = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} A^{-1} \ \rightarrow \ BA = P \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} \ \rightarrow \ P^{-1} (BA) P = \begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix} P^{-1} = (AB) P$

若n阶矩阵$A$能够相似于一个对角矩阵，则称为$A$可对角化，$P^{-1}AP=diag\{ \lambda_1, \lambda_2, ...,\lambda_n \}$

若$A$可对角化，则$A \sim A^T$

$Def. 2 $ 数域$K$上n阶矩阵$A$可对角化的充分必要条件：$K^n$中有n个线性无关的列向量$\mathbf{a_1,a_2,...,a_n}$，以及$K$中的n个数$\lambda_1, \lambda_2, ..., \lambda_n$，使得$$A \mathbf{a_i} = \lambda_i \mathbf{a_i}, \quad i=1,2,...,n $$

令$P = (\mathbf{a_1,a_2,...,a_n})$，则$\(P^{-1}AP = diag\{ \lambda_1, \lambda_2, ..., \lambda_n \}$\)

特征值

$Def. 1 $ 设$A$是数域$K$上的n阶矩阵，若$K^n$中有非零列向量$\mathbf{a}$使得：

\[ A \mathbf{a} = \lambda_0 \mathbf{a} \]

则称$\lambda_0$是矩阵$A$的一个特征值，$\mathbf{a}$是$A$对应于特征值$\lambda_0$的特征向量。

$\lambda_0$是$A$的一个特征值当且仅当$\lambda_0$是特征多项式$|\lambda I - A|=0$在$K$的一个根
$\mathbf{a}$是$A$的属于$\lambda_0$的一个特征向量当且仅当$\mathbf{a}$是齐次线性方程组$(\lambda_0 I - A) \mathbf{x} = \mathbf{0}$的一个非零解
设$A \sim B$，则$|\lambda I -B|=|\lambda I -A|$
相似矩阵具有相同的特征数（重数也相同）
对于齐次线性方程组$(\lambda_j I-A)x=0$的一个基础解系:$\eta_1,\eta_2,...,\eta_t$，则$A$属于$\lambda_j$的全部特征向量组成的集合为：

\[ \{ k_1 \eta_1 + k_2 \eta_2+...+ k_t \eta_t \ | \ k_1,k_2,...,k_t \in K,\text{且不全为0} \} \]

$\lambda_1$作为$A$的特征多项式的根的重数叫做$\lambda_1$的代数重数，把$A$的属于$\lambda_1$特征子空间的维数叫做$\lambda_1$的几何重数（几何重数不超过代数重数）
设$f(x)=a_0+a_1 x+...+a_m x^m$是数域$K$上的一个多项式。证明：若$\lambda_0$是$K$上n阶矩阵$A$的一个特征值，且$\mathbf{a}$是对应的一个特征向量。那么$f(\lambda_0)$是$f(A)$的一个特征值，且$\mathbf{a}$是$f(A)$的属于$f(\lambda_0)$的一个特征向量。

矩阵可对角化的条件

$Def. 1 $ 数域$K$上n阶矩阵$A$可对角化的充分必要条件为：$A$有n个线性无关的特征向量$\mathbf{a_1,a_2,...,a_n}$，即：

\[ P=(\mathbf{a_1,a_2,...,a_n}) \]

则$P^{-1} A P = diag \{ \lambda_1,\lambda_2,...,\lambda_n \}$，其中$\lambda_i$是$\mathbf{a_i}$所属的特征值。这个对角矩阵$diag \{ \lambda_1,\lambda_2,...,\lambda_n \}$是$A$的相似标准形。

若各组向量数之和$r_1+r_2+...+r_m<n$，则$A$没有n个线性无关的特征向量，因此$A$不可对角化。(不同特征值对应的特征向量互相线性无关)

若数域$K$上的n阶矩阵$A$可对角化的充分必要条件：$A$的特征多项式的全部复根属于$K$，且每个特征值的几何重数等于代数重数

实对称矩阵的对角化

坐标变换的实例：对于二次曲线在笛卡尔坐标系下的方程

\[ x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz - 1 =0 \]

通过直角坐标变换，消去方程中的交叉项，只留下平方项($\mathbf{T}$是正交矩阵，$T^{-1}=T^T$)：

\[ \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} = \mathbf{T} \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} \]

\[ \begin{aligned} x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz = \\ \begin{pmatrix} x \ \ y \ \ z \end{pmatrix} \begin{pmatrix} 1 & -2 & -4 \\ -2 & 4 & -2 \\ -4 & -2 & 1 \\ \end{pmatrix} \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} \\ \end{aligned} \]

代入后得到：

\[ \begin{pmatrix} x^* \ \ y^* \ \ z^* \end{pmatrix} \mathbf{T^T A T} \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} \\ \]

显然$A$是实数域上的对称矩阵（$A=\bar{A}$），为了使得方程只留下平方项，需要$T^T A T（T^{-1}AT）$为对角矩阵，即$A$可对角化。

若n阶实矩阵$A,B$存在一个n阶正交矩阵$T$，使得$T^{-1}AT=B$，则$A$正交相似于$B$

实对称矩阵的特征多项式的每一个复根都是实数，从而它们都是特征值
实对称矩阵$A$的属于不同特征值的特征向量是正交的$(\mathbf{a_1,a_2})=0$
实对称矩阵一定正交相似于对角矩阵（$T^{-1}AT=diag\{\lambda_1,\lambda_2,...,\lambda_n \}$）
n阶实矩阵$A$正交相似于一个对角矩阵$D$，则$A$一定是对称矩阵，$T^{-1}AT=D, \ A^T = (TDT^{-1})^T = TDT^{-1} = A$

二次型

$Def. 1 $ 数域$K$上的一个n元二次型是系数在$K$中的n个变量的二次齐次多项式：

\[ f(x_1,x_2,...,x_n) = \sum_{i=1}^{n} \sum_{j=1}^{n} a_{ij} x_i x_j \]

其中$a_{ij}=a_{ji}, \ 1 \leq i,j \leq n$

所有系数可排成一个n阶矩阵$A$。称为二次型$f(x_1,...,x_n)$的矩阵，显然$A$是对称且唯一的，主对角元是$x_1^2,x^2_2,...,x^2_n$的系数，$(i,j)$元是$x_i x_j$的系数的一半:

\[ A = \begin{pmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{12} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ... & a_{nn}\\ \end{pmatrix}, \ X = \begin{pmatrix} x_1 \\ x_2 \\ ...\\ x_n \\ \end{pmatrix} \]

因此二次型$f(x_1,...,x_n)$可以表示为：$\(f(x_1,...,x_n) = X^T A X$\)

令$Y=\begin{pmatrix} y_1 \\ y_2 \\ ...\\ y_n \\ \end{pmatrix}$，设$C$是数域$K$上的n阶可逆矩阵，则存在:

\[ X = CY \]

称为变量$x_1,x_2,...,x_n$到$y_1,...,y_n$的非退化线性替换

\[ X^T AX = (CY)^T A (CY) = Y^T (C^T A C) Y \]

记$B=C^{T}AC$，则$X^{T} A X = Y^{T} B Y$，$B$也是对称矩阵。

$Def .2 $ 对于数域$K$上的两个n元二次型$X^{T} A X$与$Y^{T}BY$，若存在一个非退化线性替换$X=CY$，使得$X^{T}AX$转换为$Y^{T}BY$，那么两者等价，记作$\(X^{T}AX \simeq Y^{T}BY$\)。

$Def.3 $ 数域$K$上两个n阶矩阵$A,B$，若存在$K$上一个n阶可逆矩阵$C$，使得：

\[ C^{T} A C = B \]

则称$A$与$B$合同，记作$A \simeq B$。

当两个n元二次型$X^{T}AX，Y^{T}BY$等价当且仅当n阶矩阵$A，B$合同
若二次型$X^{T}AX$等价于一个只含平方项的二次型，称为标准形
若对称矩阵$A$合同于一个对角矩阵，则称为合同标准形

对于n阶实对称矩阵$A$，存在一个n阶正交矩阵$T$，使得$T^{-1}AT$是对角矩阵$diag \{ \lambda_1,\lambda_2,...,\lambda_n \}$，其中$\lambda_1,\lambda_2,...,\lambda_n$是$A$的特征值。因为$T^{-1} = T^T$，因此$A$合同于$diag \{ \lambda_1,\lambda_2,...,\lambda_n \}$。

因此，$X=TY$称为正交替换。

数域$K$上任一对称矩阵都合同于一个对角矩阵
数域$K$上任一n元二次型都等价于一个只含平方项的二次型。（方法：成对的初等行、列变换法）
数域$K$上n元二次型$X^{T}AX$的任一标准形中，系数不为0的平方项个数等于矩阵$A$的秩，$rank(A)=r$

$Exercise. $ 将二次曲面方程化作标准方程：

\[ x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz + 2x + y + 2z - \frac{25}{16} = 0 \]

取二次项部分：$f(x,y,z)=x^2 + 4y^2 + z^2 - 4xy - 8xz - 4yz$，二次型矩阵为：

\[ \begin{pmatrix} A = \begin{pmatrix} 1 & -2 & -4 \\ -2 & 4 & -2 \\ -4 & -2 & 1 \\ \end{pmatrix} \\ |\lambda I - A| = (\lambda +4 )(\lambda - 5)^2 = 0 \\ \end{pmatrix} \]

通过特征值为5，5，-4，易得特征向量$a_1,a_2,a_3$，通过施密特正交化和单位化得到$\eta_1,\eta_2,\eta_3$。因此，得到正交矩阵$T$:

\[ \begin{aligned} T =& (\eta_1,\eta_2,\eta_3) \\ T^{-1} A T = T^{T}A & T = diag\{ 5,5,-4 \} \end{aligned} \]

作正交替换,使得二次型$f(x,y,z)$化为标准形$5{x'}^2 + 5{y'}^2-4{z'}^2$：

\[ \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} = T \begin{pmatrix} x' \\ y' \\ z' \\ \end{pmatrix} \]

得到二次曲面的新方程：

\[ \begin{aligned} 5{x'}^2 + 5{y'}^2 - 4{z'}^2 + 3z' - \frac{25}{16} = 0 \\ 5{x'}^2 + 5{y'}^2 - 4{(z' - \frac{3}{8})}^2 - 1 = 0 \\ \end{aligned} \]

作移轴：

\[ \begin{cases} x^* = x' \\ y^* = y' \\ z^* = z' - \frac{3}{8} \\ \end{cases} \]

则方程转变为：$5 {x^*}^2 + 5 {y^*}^2 - 4{z^*}^2 = 1$

因此，总的直角坐标变换公式为：

\[ \begin{pmatrix} x \\ y \\ z \\ \end{pmatrix} = T \begin{pmatrix} x^* \\ y^* \\ z^* + \frac{3}{8} \\ \end{pmatrix} = T \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} + T \begin{pmatrix} 0 \\ 0 \\ \frac{3}{8} \\ \end{pmatrix} = T \begin{pmatrix} x^* \\ y^* \\ z^* \\ \end{pmatrix} + \begin{pmatrix} \frac{1}{4} \\ \frac{1}{8} \\ \frac{1}{4} \\ \end{pmatrix} \]

$Exercise. $ 设$A$是数域$K$上的n阶矩阵，证明：$A$是斜对称矩阵当且仅当对于$K^n$中任一列向量$\mathbf{a}$，有$\mathbf{a}^T A \mathbf{a} = 0$

必要性：因为$A$是斜对称矩阵，所以$A^T = -A$，因此$(\mathbf{a}^T A \mathbf{a})^T = \mathbf{a}^T A^T \mathbf{a} = -\mathbf{a}^T A \mathbf{a} = 0$，因此$\mathbf{a}^T A \mathbf{a} = 0$
充分性：设$A$的列向量$\mathbf{a_1,a_2,...,a_n}$，已知$\epsilon_i^T A \epsilon_i = \epsilon_i^T \mathbf{a_i} = a_{ii} = 0, \quad i=1,2,...,n$ ，$(\epsilon_i + \epsilon_j)^T A (\epsilon_i + \epsilon_j) = (\epsilon_i + \epsilon_j)^T (\mathbf{a_i} + \mathbf{a_j}) = a_{ii} + a_{ij} + a_{ji} + a_{jj} = a_{ij} + a_{ji}, \quad i \neq j$，因此是$A$斜对称矩阵

$Exercise.$ 设n阶实对称矩阵$A$的全部特征值按大小顺序排成$\lambda_1 \geq \lambda_2 \geq ... \geq \lambda_n$。证明：对于$R^n$中任一非零列向量$\mathbf{a}$，都有$\(\lambda_n \leq \frac{\mathbf{a}^T A \mathbf{a}}{|\mathbf{a}|^2} \leq \lambda_1$\)

因为$A$为n阶实对称矩阵，因此存在正交矩阵$T$，使得$T^{-1}AT = diag\{ \lambda_1,\lambda_2,...,\lambda_n \}$，设$\mathbf{a}$为一个$R^n$中的非零列向量，$(T \mathbf{a})^T = (b_1,b_2,...,b_n)$，因此：

\[ \begin{aligned} \mathbf{a}^T A \mathbf{a} =& \mathbf{a}^T T \ diag\{ \lambda_1,\lambda_2,...,\lambda_n \} \ T \mathbf{a} = (T \mathbf{a})^T diag\{ \lambda_1,\lambda_2,...,\lambda_n \} (T \mathbf{a}) \\ =& \lambda_1 b^2_1 + \lambda_2 b^2_2 + ... + \lambda_n b^2_n \\ \end{aligned} \]

显然，$\lambda_n |\mathbf{a}|^2 \leq \mathbf{a}^T A \mathbf{a} \leq \lambda_1 (b_1^2 + b_2^2 + ... + b_n^2) = \lambda_1 |\mathbf{a}|^2$

因此：$\(\lambda_n \leq \frac{\mathbf{a}^T A \mathbf{a}}{|\mathbf{a}|^2} \leq \lambda_1$\)

实二次型的规范形

实二次型$X^T AX$的规范形是：

\[ z_1^2 + z_2^2 + ... + z_p^2 - z_{p+1}^2 - ... - z_r^2 \]

规范形只含平方项，且系数为1，-1，0，系数为1的平方项写在前面，其中平方项的个数等于矩阵$A$的秩$rank(A)$，

$Def. 1 \ \(惯性定理：n元实二次型$X^T AX\)的规范形是唯一的。

其中，系数为+1的平方项个数$p$称为二次型的正惯性指数，系数为-1的平方项个数$r-p$称为二次型的负惯性指数。正惯性指数减去负惯性指数的差$2p-r$称为$X^TAX$的符号差。
两个n元实二次型等价$ \leftrightarrow $规范形相同$ \leftrightarrow $秩相等，且正惯性指数相等
若$A$合同于对角矩阵$diag\{ 1,...,1,-1,...,-1,0,...,0 \}$（1的个数等于正惯性指数，-1的个数等于负惯性指数），则其为$A$的合同规范形
两个n阶实对称矩阵合同$ \leftrightarrow $秩相等，正惯性指数相等

复二次型的规范形

设n元复二次型$X^T AX$通过一个非退化线性替换$X=CY$转换成标准形：

\[ d_1 y^2_1 + d_2 y^2_2 + ... + d_r y^2_r \]

$r$即为二次型的秩，$d_i \neq 0 , \ i=1,2,...,r$。假设$d_j=r_j (cos \theta_j + i \ sin\theta_j), \ 0 \leq \theta_j < 2 \pi$，易得：

\[ d_j = [± \sqrt{r_j} (cos \frac{\theta_j}{2} + i \ \frac{sin\theta_j}{2}) ]^2 \]

因此将$\sqrt{r_j} (cos \frac{\theta_j}{2} + i \ \frac{sin\theta_j}{2})$记作$\sqrt{d_jd_j}$，则再作非退化线性替换为：

\[ \begin{cases} y_j = \frac{1}{\sqrt{d_j}} z_j, \ j=1,2,...,r\\ y_l = z_l, \ l=r+1,r+2,...,n \end{cases} \]

因此$X^T AX$的标准形：

\[ z_1^2 + z_2^2 + ... + z_r^2 \]

便是复二次型$X^T AX$的规范型，只含平方项，且系数为1或0。复二次型$X^T AX$的规范型完全由秩决定。

复二次型$X^T AX$的规范形是唯一的
两个n元复二次型等价$ \leftrightarrow $规范形相同$ \leftrightarrow $秩相等
任一n阶复对称矩阵$A$合同于对角矩阵$\begin{pmatrix} I_r & 0 \\ 0 & 0 \end{pmatrix}$，其中$r=rank(A)$。
两个n阶复对称矩阵合同$ \leftrightarrow $秩相等

正定二次型

若对于$R^n$中任意非零列向量$\mathbf{a}$，都由$\mathbf{a}^T A \mathbf{a} > 0$，则称$X^T AX$为正定二次型。

n元实二次型$X^T AX$正定，当且仅当其正惯性指数等于n，其规范形为：$$y_1^2+y_22+...+y^2_n $$
n元实二次型$X^T AX$是正定的 $ \leftrightarrow $ $A$的正惯性指数等于n $ \leftrightarrow $ $A$合同于对角矩阵$I_n$，即$A \simeq I_n$ $ \leftrightarrow $ $A$的特征值全为正
与正定矩阵合同的实对称矩阵也是正定矩阵
非退化线性退化不会给改变实二次型的正定性
正定矩阵的行列式大于0，$A=C^T I_n C，|A|=|C^T C| = |C|^2>0$

$Def. 1 $ 若对于$R^n$中任一非零列向量$\mathbf{a}$，都有：

\[ \mathbf{a}^T A \mathbf{a} \geq 0，\quad (\mathbf{a}^T A \mathbf{a} < 0, \ \mathbf{a}^T A \mathbf{a} \leq 0) \]

则该n元实二次型$X^T AX$称为半正定（负定，半负定）。

n元实二次型$X^T AX$是半正定$\ \leftrightarrow \$正惯性指数等于秩$ \leftrightarrow $规范形为$y_1^2+...+y_r^2$ $ \leftrightarrow $标准形中n个系数均非负

$Def. 2 $ 黑塞（Hesse）矩阵:设二元实值函数$F(x,y)$有一个稳定点$\mathbf{a}=(x_0,y_0)$，即在该点的一阶偏导数全为0，设$F(x,y)$在$(x_0,y_0)$的一个邻域里有3阶连续偏导数，令：

\[ \mathbf{H} = \begin{pmatrix} F''_{xx}(x_0,y_0) & F''_{xy}(x_0,y_0) \\ F''_{xy}(x_0,y_0) & F''_{yy}(x_0,y_0) \end{pmatrix} \]

称$\mathbf{H}$为$F(x,y)$在$(x_0,y_0)$处的黑塞矩阵。若黑塞矩阵$\mathbf{H}$正定，则$F(x,y)$在$(x_0,y_0)$处具有极小值。若负定，则$F(x,y)$在$(x_0,y_0)$处具有极大值。

将$F(x,y)$在$(x_0,y_0)$处展开为Talyor级数，得：

\[ F(x_0+h, y_0+k) = F(x_0,y_0) + [h F'_x(x_0,y_0) + k F'_y(x_0,y_0)] + \frac{1}{2} [h^2 F''_{xx}(x_0,y_0) + 2hk F''_{xy}(x_0,y_0) + k^2 F''_{yy}(x_0,y_0)] + R \]

设$a=F''_{xx}(x_0,y_0),b=F''_{xy}(x_0,y_0),c=F''_{yy}(x_0,y_0)$，则：

\[ f(h,k) = F(x_0+h, y_0+k) - F(x_0,y_0)= ah^2 + 2bhk + ck^2 + R \]

是$h,k$的实二次型，其矩阵就是$\mathbf{H}$。若正定，则对于足够小的$|h|,|k| \neq 0$，有

\[ F(x_0+h, y_0+k) - F(x_0,y_0) > 0 \]

表明$F(x,y)$在$(x_0,y_0)$处具有极小值。负定的情况相反，达到极大值。

推广到n元形式，设$F(x_1,x_2,...,x_n)$在$\mathbf{a}=(a_1,a_2,...,a_n)$处有连续的3阶偏导数，则黑塞矩阵$\mathbf{H}=(F''_{x_i x_j}(\mathbf{a}))$。