【线性代数】二次型
文章内容
- 二次型及其标准型
- 配方法
- 正/负定二次型
二次型及其标准型
什么是二次型和其标准型
定义:数域K上的一个n元二次型是系数在K中的n个变量的二次齐次多项式
一般形式:f(x1,x2,⋯ ,xn)=(a11x12+2a12x1x2+2a13x1x3+⋯+2a1nx1xn)+(a22x12+2a23x2x3+⋯+2a2nx2xn)+⋯+annxn2f(x_1,x_2,\cdots,x_n)=(a_{11}x_1^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n)+(a_{22}x_1^2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n)+\cdots+a_{nn}x_n^2f(x1,x2,⋯,xn)=(a11x12+2a12x1x2+2a13x1x3+⋯+2a1nx1xn)+(a22x12+2a23x2x3+⋯+2a2nx2xn)+⋯+annxn2
观察易得,这个式子里面未知数仅由 xi2x_i^2xi2 和 xixjx_ix_jxixj 组成
对于一个二次型 ax2+bxy+cy2=1ax^2+bxy+cy^2=1ax2+bxy+cy2=1,这个式子的几何意义是一个歪了的椭圆或者双曲线或者其它图形,例如一个椭圆,我们的目的是将这个椭圆的中心点回到坐标原点,让轴水平和竖直,也就是进行一个变换操作,将椭圆标准化,准确地说就是将原来的方程变换为标准方程,对应的标准方程就是这个二次型的标准型。
- 椭圆标准方程:x2a2+y2b2=1(a>b>0)\frac{x^2}{a^2}+\frac{y^2}{b^2}=1 \quad (a>b>0)a2x2+b2y2=1(a>b>0)
- 双曲线标准方程:x2a2−y2b2=1(a>b>0)\frac{x^2}{a^2}-\frac{y^2}{b^2}=1 \quad (a>b>0)a2x2−b2y2=1(a>b>0)
对于上边二次型的一般形式,可以用矩阵的形式来表达:
f(x1,x2,⋯ ,xn)=[x1x2⋯xn][a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann][x1x2⋯xn]f(x_1,x_2,\cdots,x_n)=\begin{bmatrix} x_1 & x_2 & \cdots & x_n \end{bmatrix}\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \cdots \\ x_n \end{bmatrix}f(x1,x2,⋯,xn)=[x1x2⋯xn]⎣⎡a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann⎦⎤⎣⎡x1x2⋯xn⎦⎤
令 x=[x1x2⋯xn]T,A=[a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann]x= \begin{bmatrix} x_1 & x_2 & \cdots & x_n \end{bmatrix}^T,A=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix}x=[x1x2⋯xn]T,A=⎣⎡a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann⎦⎤,则 f=xTAxf=x^TAxf=xTAx,其中 AAA 是对称矩阵,这里被称为二次型的矩阵
- 任意一个二次型和它的实对称矩阵是一一对应的
- 实对称矩阵 AAA 的秩就是二次型 fff 的秩
当把一个二次型写成矩阵表达式时,矩阵 AAA 一定是一个对称矩阵;但当把一个矩阵表达式写成二次型时,即使矩阵 AAA 不是对称矩阵,展开后仍然是一个二次型。
原因:自己展开尝试一下就理解了,二次型中每个含两个未知数的积的系数都是aaa的2倍,因此相应对称矩阵 AAA 中的对应值就是 aaa,当将矩阵表达式转换为二次型时,是在对应位置的参数相加,而当二次型转换为矩阵表达式时,则是对当前系数除以二作为相应矩阵的对应值。
例:写出二次型 f(x,y,z)=x2−3z2−4xy+yzf(x,y,z)=x^2-3z^2-4xy+yzf(x,y,z)=x2−3z2−4xy+yz 的实对称矩阵以及矩阵表达式
矩阵表达式:f(x,y,z)=[xyz][1−20−201201232][xyz]f(x,y,z)=\begin{bmatrix}x & y & z \end{bmatrix} \begin{bmatrix} 1 & -2 & 0 \\ -2 & 0 & \frac{1}{2} \\ 0 & \frac{1}{2} & \frac{3}{2} \end{bmatrix} \begin{bmatrix}x \\ y \\ z \end{bmatrix}f(x,y,z)=[xyz]⎣⎡1−20−202102123⎦⎤⎣⎡xyz⎦⎤
对于这里的实对称矩阵 AAA 中对应系数的位置,可以想象成这样一个表格:
x | x2x^2x2的系数 | xyxyxy的系数 | xzxzxz的系数 |
y | xyxyxy的系数 | y2y^2y2的系数 | yzyzyz的系数 |
z | xzxzxz的系数 | yzyzyz的系数 | z2z^2z2的系数 |
根据二次型中 x2,y2,z2x^2,y^2,z^2x2,y2,z2 的系数和 xy,xz,yzxy, xz, yzxy,xz,yz 的系数来写矩阵即可
合同变换
例如一个二次型的矩阵表达式: f=[x1x2x3][c11c12c13c21c22c23c31c32c33][x1x2x3]f=\begin{bmatrix} x_1 & x_2 & x_3 \end{bmatrix}\begin{bmatrix} c_{11} & c_{12} & c_{13} \\ c_{21} & c_{22} & c_{23} \\ c_{31} & c_{32} & c_{33} \\ \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix}f=[x1x2x3]⎣⎡c11c21c31c12c22c32c13c23c33⎦⎤⎣⎡x1x2x3⎦⎤
我们对其中的三个元素 x1,x2,x3x_1, x_2, x_3x1,x2,x3 做线性变换,即: [x1x2x3]=[c11c12c13c21c22c23c31c32c33][y1y2y3]\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} c_{11} & c_{12} & c_{13} \\ c_{21} & c_{22} & c_{23} \\ c_{31} & c_{32} & c_{33} \\ \end{bmatrix}\begin{bmatrix} y_1 \\ y_2 \\ y_3 \end{bmatrix}⎣⎡x1x2x3⎦⎤=⎣⎡c11c21c31c12c22c32c13c23c33⎦⎤⎣⎡y1y2y3⎦⎤
则有:f(x)=xTAx=(Cy)TA(Cy)=yTCTACy=yT(CTAC)y=yTByf(x)=x^TAx=(Cy)^TA(Cy)=y^TC^TACy=y^T(C^TAC)y=y^TByf(x)=xTAx=(Cy)TA(Cy)=yTCTACy=yT(CTAC)y=yTBy,这里 B=CTACB=C^TACB=CTAC
设 A,BA,BA,B 为 nnn 阶矩阵,如果存在可逆矩阵 CCC,使得 B=CTACB=C^TACB=CTAC,则称 AAA 与 BBB 合同,记作 . ,这种对 AAA 的运算被称为合同变换。
注意这里不要与相似变换混淆的概念,相似变换是 B=P−1APB=P^{-1}APB=P−1AP,相似变换是在不同基的同一矩阵进行变换,而合同变换则表示二次型到标准型的变换
将二次型转换为标准型
要想将其化为标准型,我们需要将所有的xixjx_ix_jxixj的系数变为0,不难想到,当矩阵 AAA 除正对角线以外的元素都为0时,所有 xixjx_ix_jxixj 的系数也就为0了。
对于合同变换,可以看到,矩阵 BBB 与矩阵 CCC 和矩阵 AAA 相关,而向量 yyy 与向量 xxx 和矩阵 CCC 相关,我们不关心向量y是什么样的,在新的式子中,我们要通过矩阵 CCC 将矩阵 AAA 的除正对角线以外的所有元素都变换为0,得到这样一个矩阵 BBB,最后也就得到了二次型对应的标准型。
定理:对于任一个 n 元二次型 f(x)=xTAxf(x)=x^TAxf(x)=xTAx,存在正交变换 x=Qyx=Qyx=Qy (QQQ 为 n 阶正交矩阵),使得 xTAx=yT(QTAQ)y=λ1y12+λ2y22+⋯+λnyn2x^TAx=y^T(Q^TAQ)y=\lambda_1 y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2xTAx=yT(QTAQ)y=λ1y12+λ2y22+⋯+λnyn2。其中 λ1,λ2,⋯ ,λn\lambda_1,\lambda_2,\cdots,\lambda_nλ1,λ2,⋯,λn 是实对称矩阵 AAA 的 n 个特征值,QQQ 的 n 个列向量 α1,α2,⋯ ,αn\alpha_1, \alpha_2, \cdots, \alpha_nα1,α2,⋯,αn 是 AAA 对应于特征值 λ1,λ2,⋯ ,λn\lambda_1, \lambda_2, \cdots, \lambda_nλ1,λ2,⋯,λn 的标准正交特征向量.
- 任一实对称矩阵都与一个对角阵合同
- 用正交变换化二次型为标准型,具有保持几何形状不变的优点
这里的 xxx 是二次型中的未知数,yyy 是该二次型对应的标准型中的未知数
在对称矩阵的相似对角化中讲过,任何一个对称矩阵,都可以通过一个正交变换变为一个对角阵,这是实对称矩阵的特点。即:nnn 阶实对称矩阵 AAA 必可相似对角化,且总存在正交矩阵 QQQ,使得 QTAQ=diag(λ1,λ2,⋯ ,λn)Q^TAQ=diag(λ1,λ2,⋯ ,λn)QTAQ=diag(λ1,λ2,⋯ ,λn),其中 λ1,λ2,⋯ ,λnλ1,λ2,⋯ ,λnλ1,λ2,⋯ ,λn\lambda_1,\lambda_2,\cdots,\lambda_nλ1,λ2,⋯ ,λnλ1,λ2,⋯,λn 是矩阵 AAA 的特征值.
即:Q−1AQ=QTAQ=Λ=[λ1λ2⋯λn]Q^{-1}AQ=Q^TAQ=\Lambda=\begin{bmatrix} \lambda_1 & & \\ & \lambda_2 & & \\ & & \cdots & \\ & & & \lambda_n \end{bmatrix}Q−1AQ=QTAQ=Λ=⎣⎡λ1λ2⋯λn⎦⎤
当我们通过 B=QTAQ=ΛB=Q^TAQ=\LambdaB=QTAQ=Λ,即矩阵 BBB 变为一个对角阵,对角阵中除正对角线以外其它位置的值都为0,最后 yTByy^TByyTBy当然只剩下平方项了。
正交矩阵中每一个向量都满足和其本身内积为1,和其它向量内积为0,且正交矩阵的转置和其逆矩阵相同。
从中也可以看出,这里这个合同变换的方法本质上就是相似变换,不过这里的相似变换是由正交变换构成的。
参考相似对角化的概念,这里就是矩阵 AAA 和一个对角阵 Λ\LambdaΛ 相似,性质当然也相同:
- 对角阵 Λ\LambdaΛ 的值是矩阵 AAA 的特征值
- 矩阵 QQQ 中的列向量为矩阵 AAA 的特征向量
同时,在这里因为矩阵 QQQ 是正交矩阵,因此矩阵 AAA 中的特征向量相互正交,即其中的每一个向量都满足和其本身内积为1,和其它向量内积为0。
此外,由于对角阵中的元素为矩阵 AAA 对应的特征值,因此对于一个二次型对应的标准型,该标准型中未知数的系数就是矩阵 AAA 对应的特征值。
二次型变换为标准型的本质
先联想一下相似变换的本质,相似变换就是从一个基到另一个基,但原本图形形状不做改变的过程,仅仅是同一图形在不同基下的表达形式而已。因此,对于二次型标准化的本质也就清楚了,所谓二次型标准化,本质上就是基的改变,通过定义一个新的基,使得原图形在新的基下是标准形式,然后再通过相似变换将原图形映射过去即可。
我们之前讲过线性空间中的基是什么,参考上图,这里再通俗点讲,就是构建了一个新的坐标系,使得图形在新的坐标系下的方程是标准方程。
规范型:在标准型中,若平方项的系数为1或-1或0,则称其为二次型的规范型。
例:某二次型的标准型为 8y12+12y22−9y32=18y_1^2+\frac{1}{2}y_2^2-9y_3^2=18y12+21y22−9y32=1
则有:(22y1)2+(12y2)2−(3y3)2=z12+z22+z32=1(2\sqrt 2y_1)^2+(\frac{1}{\sqrt 2}y_2)^2-(3y_3)^2=z_1^2+z_2^2+z_3^2=1(22y1)2+(21y2)2−(3y3)2=z12+z22+z32=1
z12+z22+z32=1z_1^2+z_2^2+z_3^2=1z12+z22+z32=1 这种形式就是规范型,但注意它对于原来的图形在形状上已经伸缩变换了。
例:求一个正交变换 x=Pyx=Pyx=Py,把二次型 f=−2x1x2+2x1x3+2x2x3f=-2x_1x_2+2x_1x_3+2x_2x_3f=−2x1x2+2x1x3+2x2x3 化为标准型
想将二次型化为标准型,其实就是求我们上述所讲的矩阵 PPP 和矩阵 Λ\LambdaΛ,由于矩阵 PPP 中的列向量就是矩阵 AAA 的特征向量,而矩阵 Λ\LambdaΛ 中的值则为矩阵 AAA 的特征值,因此我们首先要求出来矩阵 AAA 的特征向量和特征值。
易得该二次型对应的矩阵表达式为:
f(x)=[x1x2x3][0−11−101110][x1x2x3]f(x)=\begin{bmatrix} x_1 & x_2 & x_3 \end{bmatrix} \begin{bmatrix} 0 & -1 & 1 \\ -1 & 0 & 1 \\ 1 & 1 & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix}f(x)=[x1x2x3]⎣⎡0−11−101110⎦⎤⎣⎡x1x2x3⎦⎤
要想化为标准型,我们首先要找到矩阵 AAA 对应的对角阵 Λ\LambdaΛ,也就是也行哦爱你找到矩阵 AAA 对应的特征值。
因 (A−λE)x=0(A-\lambda E)x=0(A−λE)x=0,由 (A−λE)=0(A-\lambda E)=0(A−λE)=0 得有:
即:{λ1=−2λ2=λ3=1\begin{cases} \lambda_1=-2 \\ \lambda_2=\lambda_3=1 \end{cases}{λ1=−2λ2=λ3=1
当 λ1=−2\lambda_1=-2λ1=−2 时,A−λ1E=[2−11−121112]∼[101011000]A-\lambda_1 E=\begin{bmatrix} 2 & -1 & 1 \\ -1 & 2 & 1 \\ 1 & 1 & 2 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \end{bmatrix}A−λ1E=⎣⎡2−11−121112⎦⎤∼⎣⎡100010110⎦⎤
新的齐次方程组为:{x1+x3=0x2+x3=0\begin{cases} x_1 + x_3 = 0 \\ x_2 + x_3 =0 \end{cases}{x1+x3=0x2+x3=0
自由变量个数为 n−R(A−λE)=1n-R(A-\lambda E)=1n−R(A−λE)=1,主元为x1,x2x_1, x_2x1,x2,自由变量为 x3x_3x3
易得基础解系:[x1x21]\begin{bmatrix} x_1 \\ x_2 \\ 1 \end{bmatrix}⎣⎡x1x21⎦⎤
代入易得,特征向量 ξ1=[−1−11]\xi_1=\begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix}ξ1=⎣⎡−1−11⎦⎤
对于一般做法,我们这是会同理得 特征向量 ξ2=[−110],ξ3=[101]\xi_2=\begin{bmatrix} -1 \\ 1 \\ 0 \end{bmatrix}, \xi_3 = \begin{bmatrix} 1 \\ 0 \\ 1 \end{bmatrix}ξ2=⎣⎡−110⎦⎤,ξ3=⎣⎡101⎦⎤,同时观察到 ξ1\xi_1ξ1 和 ξ2\xi_2ξ2 正交,但是由于这里的特征向量是正交矩阵中的列向量,因此特征向量 ξ1,ξ2,ξ3\xi_1,\xi_2,\xi_3ξ1,ξ2,ξ3 之间两两正交,而这时如果我们这样求出来 ξ2\xi_2ξ2 和 ξ3\xi_3ξ3 的话,紧接着要使用施密特正交法进行处理,增大了计算量,因此当我们求出 ξ1\xi_1ξ1 和 ξ2\xi_2ξ2 时,参考正交矩阵两两正交的性质来求出特征向量 ξ3\xi_3ξ3,而不使用一般的方法建立基础解系来求 ξ3\xi_3ξ3。
同理得特征向量 ξ2=[−110]\xi_2=\begin{bmatrix} -1 \\ 1 \\ 0 \end{bmatrix}ξ2=⎣⎡−110⎦⎤
由于 ξ1,ξ2,ξ3\xi_1, \xi_2, \xi_3ξ1,ξ2,ξ3 之间两两正交,则易得 ξ3=[112]\xi_3=\begin{bmatrix} 1 \\ 1 \\ 2 \end{bmatrix}ξ3=⎣⎡112⎦⎤
将特征向量单位化后得:p1=13[112],p2=12[112],p3=16[112]p_1=\frac{1}{\sqrt 3}\begin{bmatrix} 1 \\ 1 \\ 2 \end{bmatrix}, p_2=\frac{1}{\sqrt 2}\begin{bmatrix} 1 \\ 1 \\ 2 \end{bmatrix}, p_3=\frac{1}{6}\begin{bmatrix} 1 \\ 1 \\ 2 \end{bmatrix}p1=31⎣⎡112⎦⎤,p2=21⎣⎡112⎦⎤,p3=61⎣⎡112⎦⎤
则正交矩阵 P=[p1p2p3]P=\begin{bmatrix} p_1 & p_2 & p_3 \end{bmatrix}P=[p1p2p3]
易得该二次型对应的标准型:f(y)=−2y12+y22+y32f(y)=-2y_1^2+y_2^2+y_3^2f(y)=−2y12+y22+y32
总结:这里二次型转标准型的计算过程基本和前一章节的求法相同,主要是求特征值和特征向量,这两个求出来,结果自然也就出来了。
例:求椭圆 x2+4xy+5y2=1x^2+4xy+5y^2=1x2+4xy+5y2=1 的面积
二次型转换为其标准型,图形形状不变,则图形对应面积也不变,因此我们可以先将不标准的椭圆标准化得到其标准型,然后再求面积即可。
易得该二次型的矩阵表达式:f(x,y)=[xy][1225][xy]f(x,y)=\begin{bmatrix} x & y \end{bmatrix}\begin{bmatrix} 1 & 2 \\ 2 & 5 \end{bmatrix}\begin{bmatrix} x \\ y\end{bmatrix}f(x,y)=[xy][1225][xy],其中 A=[1225]A=\begin{bmatrix} 1 & 2 \\ 2 & 5 \end{bmatrix}A=[1225]
由 (A−λE)x=0(A-\lambda E)x=0(A−λE)x=0 得 ∣A−λE∣=∣1−λ225−λ∣=λ2−6λ+1=0|A-\lambda E| = \begin{vmatrix} 1-\lambda & 2 \\ 2 & 5-\lambda \end{vmatrix} = \lambda^2-6\lambda+1=0∣A−λE∣=∣∣1−λ225−λ∣∣=λ2−6λ+1=0
求根公式得 {λ1=6+422λ2=6−422\begin{cases} \lambda_1 = \frac{6+4\sqrt 2}{2} \\ \lambda_2 = \frac{6-4\sqrt 2}{2} \end{cases}{λ1=26+42λ2=26−42
求根公式 (初中数学):x=−b±b2−4ac2ax = \frac{-b \pm \sqrt {b^2-4ac}}{2a}x=2a−b±b2−4ac
特征值较复杂,对应的特征向量应该也比较复杂,因此这里紧接着先不算特征向量,因为对于这道题我们并没有必要去求正交矩阵。
假设特征向量为 ξ1,ξ2\xi_1, \xi_2ξ1,ξ2
则矩阵 Q=[ξ1ξ2]Q=\begin{bmatrix} \xi_1 & \xi_2 \end{bmatrix}Q=[ξ1ξ2],Λ=QTAQ=[λ100λ2]\Lambda=Q^TAQ=\begin{bmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{bmatrix}Λ=QTAQ=[λ100λ2]
设标准型下 x,yx,yx,y 对应的两个未知数分别为 u,vu,vu,v
则有 [xy]=Q[uv]\begin{bmatrix} x \\ y \end{bmatrix} = Q\begin{bmatrix} u \\ v \end{bmatrix}[xy]=Q[uv],则原式 f=λ1u2+λ2v2=1f=\lambda_1 u^2+ \lambda_2 v^2=1f=λ1u2+λ2v2=1
整理得:u2(1λ1)2+v2(1λ2)2=1\frac{u^2}{(\sqrt{\frac{1}{\lambda_1}})^2}+\frac{v^2}{(\sqrt{\frac{1}{\lambda_2}})^2}=1(λ11)2u2+(λ21)2v2=1
这里就是椭圆的标准公式:x2a2+y2b2=1\frac{x^2}{a^2}+\frac{y^2}{b^2}=1a2x2+b2y2=1
即 a=1λ1,b=1λ2a=\sqrt{\frac{1}{\lambda_1}},b=\sqrt{\frac{1}{\lambda_2}}a=λ11,b=λ21
由椭圆面积公式得:S=πab=πλ1λ2=π1=πS=\pi ab=\frac{\pi}{\sqrt{\lambda_1 \lambda_2}}=\frac {\pi}{1}=\piS=πab=λ1λ2π=1π=π
正交变换具有保形性,变化前后图形形状不会发生改变
配方法
配方法很简单,共分为两种情况,这里直接通过举例来进行说明。
- 二次型中存在平方项则直接使用最简单粗暴的方法凑平方
- 二次型中不存在平方项我们先变换一次得到第一种情况,再使用相同的方法凑平方
简而言之,无论哪种情况,我们的目的都是凑平方,消去非平方项,再将平方项从 xxx 映射到 yyy 即可。
配方法的第一种使用情况
三个主要步骤:
- 式子配方成平方相加减的形式
- 写过渡矩阵,并验证该过渡矩阵行列式不为0 (矩阵可逆)
- 根据要求算出指定结果
例:化二次型 f=x12+2x22+5x32+2x1x2+2x1x3+6x2x3f=x_1^2+2x_2^2+5x_3^2+2x_1x_2+2x_1x_3+6x_2x_3f=x12+2x22+5x32+2x1x2+2x1x3+6x2x3 成标准型,并求出所使用的变换矩阵。
到这里,已经求出来该二次型对应的标准型了,即:f=y12+y22f=y_1^2+y_2^2f=y12+y22,接下来求变换矩阵。
令 {y1=x1+x2+x3y2=x2+2x3y3=x3\begin{cases} y_1 = x_1+x_2+x_3 \\ y_2=x_2+2x_3 \\ y_3=x_3 \end{cases}⎩⎨⎧y1=x1+x2+x3y2=x2+2x3y3=x3,则有 {x1=y1−y2+y3x2=y2−2y3x3=y3\begin{cases} x_1=y_1-y_2+y_3 \\ x_2=y_2-2y_3 \\ x_3=y_3 \end{cases}⎩⎨⎧x1=y1−y2+y3x2=y2−2y3x3=y3
注意这里尽管没有第三个项,y3y_3y3 也不能为0,我们把式子配方成平方相加减的形式就是为了去掉所有的非平方项,剩下的这些平方项就是我们前面所说的 xxx 对应的标准型下的变量 yyy,二次型中 xxx 有三个,那 yyy 也有三个,因此不能置为0,关于 yyy 的值,一般指定为对应的 xxx 的值,这样比较有利于计算。
由 x=Qyx=Qyx=Qy 得,即 [x1x2x3]=[y1−y2+y3y2−2y3y3]=[q11q12q13q21q22q23q31q32q33][y1y2y3]\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = \begin{bmatrix} y_1-y_2+y_3 \\ y_2-2y_3 \\ y_3 \end{bmatrix} = \begin{bmatrix} q_{11} & q_{12} & q_{13} \\ q_{21} & q_{22} & q_{23} \\ q_{31} & q_{32} & q_{33} \end{bmatrix} \begin{bmatrix} y_1 \\ y_2 \\ y_3 \end{bmatrix}⎣⎡x1x2x3⎦⎤=⎣⎡y1−y2+y3y2−2y3y3⎦⎤=⎣⎡q11q21q31q12q22q32q13q23q33⎦⎤⎣⎡y1y2y3⎦⎤
易得变换矩阵 Q=[1−1101−2001]Q=\begin{bmatrix} 1 & -1 & 1 \\ 0 & 1 & -2 \\ 0 & 0 & 1 \end{bmatrix}Q=⎣⎡100−1101−21⎦⎤,且 ∣Q∣≠0|Q| \neq 0∣Q∣=0
ps:上下三角形矩阵一定可逆,因为对应行列式展开之后只有一种符号(全+或全-)
综上所述,对应标准型:f=y12+y22f=y_1^2+y_2^2f=y12+y22,变换矩阵:Q=[1−1101−2001]Q=\begin{bmatrix} 1 & -1 & 1 \\ 0 & 1 & -2 \\ 0 & 0 & 1 \end{bmatrix}Q=⎣⎡100−1101−21⎦⎤
配方法的第二种使用情况
例:化二次型 f=2x1x2+2x1x3−6x2x3f=2x_1x_2+2x_1x_3-6x_2x_3f=2x1x2+2x1x3−6x2x3 成规范型,并求出所使用的的变换矩阵。
思路:二次型中没有平方项,我们可以用平方差产生平方项
令 {x1=y1+y2x2=y1−y2x3=y3\begin{cases} x_1=y_1+y_2 \\ x_2=y_1-y_2 \\ x_3=y_3 \end{cases}⎩⎨⎧x1=y1+y2x2=y1−y2x3=y3
这里设置什么样的映射都可以,但需要保证使得计算简便,求出的过渡矩阵可逆。
则由 [x1x2x3]=C1[y1y2y3]\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix} = C_1\begin{bmatrix} y_1 \\ y_2 \\ y_3 \end{bmatrix}⎣⎡x1x2x3⎦⎤=C1⎣⎡y1y2y3⎦⎤ 易得,C1=[1101−10001]C_1 = \begin{bmatrix} 1 & 1 & 0 \\ 1 & -1 & 0 \\ 0 & 0 & 1 \end{bmatrix}C1=⎣⎡1101−10001⎦⎤,∣C1∣≠0|C_1| \neq 0∣C1∣=0
则有:
这里因为要求的不是标准型,而是标准型对应的规范型,因此将每项的系数都变换为1、-1、0的形式。
令 {z1=2(y1−y3)z2=2(y2−2y3)z3=6y3\begin{cases} z_1=\sqrt 2(y_1-y_3) \\ z_2=\sqrt 2(y_2-2y_3) \\ z_3=\sqrt 6 y_3 \end{cases}⎩⎨⎧z1=2(y1−y3)z2=2(y2−2y3)z3=6y3,则有:{y1=12z1+16z3y2=12z2+26z3y3=16z3\begin{cases} y_1= \frac {1}{\sqrt 2}z_1+\frac{1}{\sqrt 6}z_3\\ y_2=\frac{1}{\sqrt 2}z_2 + \frac{2}{\sqrt 6}z_3 \\ y_3=\frac{1}{\sqrt 6}z_3 \end{cases}⎩⎨⎧y1=21z1+61z3y2=21z2+62z3y3=61z3
由 [y1y2y3]=C2[z1z2z3]\begin{bmatrix} y_1 \\ y_2 \\ y_3 \end{bmatrix} = C_2\begin{bmatrix} z_1 \\ z_2 \\ z_3 \end{bmatrix}⎣⎡y1y2y3⎦⎤=C2⎣⎡z1z2z3⎦⎤ 易得,C2=[12016012260016]C_2 = \begin{bmatrix} \frac{1}{\sqrt 2} & 0 & \frac{1}{\sqrt 6} \\ 0 & \frac{1}{\sqrt 2} & \frac{2}{\sqrt 6} \\ 0 & 0 & \frac{1}{\sqrt 6} \end{bmatrix}C2=⎣⎡21000210616261⎦⎤,∣C2∣≠0|C_2| \neq 0∣C2∣=0
由 x=C1y,y=C2zx=C_1y, y=C_2zx=C1y,y=C2z 得,x=C1C2zx=C_1C_2zx=C1C2z
C=C1C2=[1101−10001][12016012260016]=[12123612−12−160016]C=C_1C_2=\begin{bmatrix} 1 & 1 & 0 \\ 1 & -1 & 0 \\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} \frac{1}{\sqrt 2} & 0 & \frac{1}{\sqrt 6} \\ 0 & \frac{1}{\sqrt 2} & \frac{2}{\sqrt 6} \\ 0 & 0 & \frac{1}{\sqrt 6} \end{bmatrix}=\begin{bmatrix} \frac{1}{\sqrt 2} & \frac{1}{\sqrt 2} & \frac{3}{\sqrt 6} \\ \frac{1}{\sqrt 2} & \frac{-1}{\sqrt 2} & \frac{-1}{\sqrt 6} \\ 0 & 0 & \frac{1}{\sqrt 6}\end{bmatrix}C=C1C2=⎣⎡1101−10001⎦⎤⎣⎡21000210616261⎦⎤=⎣⎡21210212−10636−161⎦⎤,∣C∣≠0|C| \neq 0∣C∣=0
综上所述,对应的标准型为 f=z12−z22+z32f=z_1^2-z_2^2+z_3^2f=z12−z22+z32,变换矩阵为 [12123612−12−160016]\begin{bmatrix} \frac{1}{\sqrt 2} & \frac{1}{\sqrt 2} & \frac{3}{\sqrt 6} \\ \frac{1}{\sqrt 2} & \frac{-1}{\sqrt 2} & \frac{-1}{\sqrt 6} \\ 0 & 0 & \frac{1}{\sqrt 6}\end{bmatrix}⎣⎡21210212−10636−161⎦⎤
总结
配方法相对更加简单,但配方法不具有保形性,也就是使用配方法进行变换后原图形可能伸缩或拉伸,如果要求求图形面积,就不能用配方法了,只能用正交变换的方法。
正/负 定二次型
惯性定理
定理 (惯性定理):二次型的标准型显然不是唯一的,只是标准型中所含项数 (二次型的秩) 是确定的,不仅如此,在限定变换为实变换时,标准型中正系数或负系数的个数是不变的,也就是有:
- 设二次型 f=xTAxf=x^TAxf=xTAx 的秩为 rrr,且有两个可逆变换 x=Cyx=Cyx=Cy 和 x=Pzx=Pzx=Pz
- 使:f=k1y12+k2y22+⋯+kryr2(ki≠0)f=k_1y_1^2+k_2y_2^2+\cdots+k_ry_r^2 \quad (k_i \neq 0)f=k1y12+k2y22+⋯+kryr2(ki=0)
- 及:f=λ1z12+λ2z22+⋯+λrzr2(λi≠0)f=\lambda_1z_1^2+\lambda_2z_2^2+\cdots+\lambda_rz_r^2 \quad (\lambda_i \neq 0)f=λ1z12+λ2z22+⋯+λrzr2(λi=0)
- 则:k1,k2,⋯ ,krk_1,k_2,\cdots,k_rk1,k2,⋯,kr 中正数的个数与 λ1,λ2,⋯ ,λr\lambda_1,\lambda_2,\cdots,\lambda_rλ1,λ2,⋯,λr 中正数的个数相等
以一个三个未知数的二次型为例,令 f(x,y,z)=1f(x,y,z)=1f(x,y,z)=1,表示空间上的一个曲面,将该二次型化为标准型后有三种情况,当三个系数都为正数的话表示一个椭球;若三个系数中一负两正,则表示一个单叶双曲面;若三个系数中一正两负,则表示一个双叶双曲面。
二次型中所做的各种可逆变换的本质是将这个曲面进行平移、旋转、缩放等
图形位置变换的本质:这里所说将这个曲面(图形)进行移动并不标准,因为本质上是相似变换,也就是基在变换,但达到的效果和曲面(图形)进行移动是相同的。
图形被伸缩或拉伸的本质:新的基与原来的基相比某些方向的单位向量大小不同。
也就是说图形本身没有变化,但衡量它的标准变化了,因此在新的标准下它看起来位置变换了或者伸缩拉伸了,而新旧标准(基)对于我们来说只是换了套坐标系。
二次型化为标准型中使用正交变换的话图形是不变的,但使用其它方法形状可能会发生一定的改变,如伸缩、拉伸等,但是无论这个图形怎样伸缩,例如单叶双曲面再怎么伸缩也是单叶双曲面,不可能通过伸缩或拉伸变成一个椭球,而它的形状又是由二次型中的系数的正负来决定的,因此变换前后正系数和负系数的个数不变。
为什么被称为惯性定理:类似于惯性中物体拥有保持当前运动状态的性质,图形也拥有保持当前形状不变的特性,因此被称为惯性定理。
正惯性指数和负惯性指数
二次型的标准型中正系数的个数称为二次型的正惯性指数;负系数的个数称为福惯性指数。若二次型 fff 的正惯性指数为 ppp,秩为 rrr,则 fff 的规范型便可确定为:f=y12+⋯+yp2−yp+12−⋯−yr2f=y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2f=y12+⋯+yp2−yp+12−⋯−yr2
正惯性指数为 ppp,二次型的秩为 rrr,则负惯性指数就为 r−pr-pr−p
正/负定判断条件
定义:若二次型 f=xTAxf=x^TAxf=xTAx 对任何 x≠0x\neq 0x=0 都有 f>0f>0f>0,则称 fff 为正定二次型,正定二次型的矩阵 AAA 为正定矩阵。例如 f=x12+2x22+5x32+8x42+6x52f=x_1^2+2x_2^2+5x_3^2+8x_4^2+6x_5^2f=x12+2x22+5x32+8x42+6x52 就是一个正定二次型。
- 若 AAA 正定,则 AAA 一定可逆,A−1A^{-1}A−1 和 A∗A^*A∗ 也一定正定
AAA 为正定矩阵,则 AAA 为对角阵且 λ1,λ2,⋯ ,λn\lambda_1, \lambda_2, \cdots, \lambda_nλ1,λ2,⋯,λn 全都大于0,由于 ∣A∣=λ1λ2⋯λn|A|=\lambda_1 \lambda_2\cdots\lambda_n∣A∣=λ1λ2⋯λn,则 ∣A∣≠0|A| \neq 0∣A∣=0,因此矩阵 AAA 一定可逆。
若 AAA 的特征值为 λ1,λ2,⋯ ,λn\lambda_1, \lambda_2, \cdots, \lambda_nλ1,λ2,⋯,λn,则 A−1A^{-1}A−1 的特征值为 1λ1,1λ2,⋯ ,1λn\frac{1}{\lambda_1}, \frac{1}{\lambda_2}, \cdots, \frac{1}{\lambda_n}λ11,λ21,⋯,λn1,因此当然 A−1A^{-1}A−1 也正定。
由 Ax=λxAx=\lambda xAx=λx 两边同乘 A−1A^{-1}A−1 易得 A−1x=1λxA^{-1}x=\frac{1}{\lambda}xA−1x=λ1x,则 A∗∣A∣x=1λx\frac{A^*}{|A|}x=\frac{1}{\lambda}x∣A∣A∗x=λ1x,整理得 A∗x=∣A∣λxA^*x=\frac{|A|}{\lambda}xA∗x=λ∣A∣x。可见若AAA 的特征值为 λ1,λ2,⋯ ,λn\lambda_1, \lambda_2, \cdots, \lambda_nλ1,λ2,⋯,λn,则A∗A^*A∗ 的特征值为 ∣A∣λ1,∣A∣λ2,⋯ ,∣A∣λn\frac{|A|}{\lambda_1}, \frac{|A|}{\lambda_2}, \cdots, \frac{|A|}{\lambda_n}λ1∣A∣,λ2∣A∣,⋯,λn∣A∣,已知 ∣A∣>0|A| > 0∣A∣>0,因此 A∗A^*A∗ 肯定也正定。
正定二次型判别法 (三个充要条件):
- fff 的标准型的 nnn 个系数全为正
- fff 的正惯性指数为 nnn (fff 的秩等于其正惯性指数)
- fff 的矩阵 AAA 的特征值全大于0
这三个条件其实都是等价的,不同说法而已
定义:若二次型 f=xTAxf=x^TAxf=xTAx 对任何 x≠0x\neq 0x=0 都有 f<0f<0f<0,则称 fff 为负定二次型,负定二次型的矩阵 AAA 为负定矩阵。例如 f=−x12−2x22−5x32−8x42−6x52f=-x_1^2-2x_2^2-5x_3^2-8x_4^2-6x_5^2f=−x12−2x22−5x32−8x42−6x52 就是一个负定二次型
负定二次型判别法 (三个充要条件):
- fff 的标准型的 nnn 个系数全为负
- fff 的负惯性指数为 nnn (fff 的秩等于其负惯性指数)
- fff 的矩阵 AAA 的特征值全小于0
对于负定二次型,和正定二次型的概念基本相同,不过相反而已,就不再过多解释了。
赫尔维茨定理
定理 (赫尔维茨定理):对称矩阵 AAA 为正定的充分必要条件是:AAA 的各阶主子式都为正,即 a11>0,[a11a12a21a22]>0,⋯ ,[a11⋯a1n⋮⋮an1⋯ann]>0a_{11}>0,\begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} >0,\cdots, \begin{bmatrix} a_{11} & \cdots & a_{1n} \\ \vdots & & \vdots \\ a_{n1}& \cdots & a_{nn} \end{bmatrix} > 0a11>0,[a11a21a12a22]>0,⋯,⎣⎡a11⋮an1⋯⋯a1n⋮ann⎦⎤>0。
对称矩阵 AAA 为负定的充分必要条件为:奇数阶主子式为负,而偶数阶主子式为正,即 (−1)r[a11⋯a1n⋮⋮an1⋯ann]>0(r=1,2,⋯ ,n)(-1)^r\begin{bmatrix} a_{11} & \cdots & a_{1n} \\ \vdots & & \vdots \\ a_{n1}& \cdots & a_{nn} \end{bmatrix} > 0 \quad (r=1,2,\cdots,n)(−1)r⎣⎡a11⋮an1⋯⋯a1n⋮ann⎦⎤>0(r=1,2,⋯,n)。
主子式:矩阵对应行列式沿主对角线上的 nnn 阶子式。
有时候矩阵的特征值比较难求,这时候就可以用赫尔维茨定理
如:若二次型 f=x12+2x22+5x32+8x42+6x52f=x_1^2+2x_2^2+5x_3^2+8x_4^2+6x_5^2f=x12+2x22+5x32+8x42+6x52
易得矩阵 A=[12586]A=\begin{bmatrix} 1 & & & & \\ & 2 & & & \\ && 5 && \\ &&& 8 & \\ &&&& 6 \end{bmatrix}A=⎣⎡12586⎦⎤
其中 ∣1∣,∣1002∣,∣100020005∣,∣1000020000050080∣,∣1000002000005000000800006∣\begin{vmatrix} 1 \end{vmatrix}, \begin{vmatrix} 1 & 0 \\ 0 & 2 \end{vmatrix}, \begin{vmatrix} 1 & 0 &0 \\ 0 & 2 & 0 \\ 0 & 0 & 5 \end{vmatrix}, \begin{vmatrix} 1 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 0 & 5 \\ 0 & 0 & 8 & 0\end{vmatrix}, \begin{vmatrix} 1 & 0 &0 & 0 &0 \\ 0 & 2 & 0 & 0 & 0 \\ 0 & 0 & 5 & 0 & 0\\ 0 & 0&0&0&8\\0&0&0&0&6 \end{vmatrix}∣∣1∣∣,∣∣1002∣∣,∣∣100020005∣∣,∣∣1000020000080050∣∣,∣∣1000002000005000000000086∣∣ 都大于0,因此该二次型为正定二次型。负定二次型同理
例:判定二次型 f=−5x2−6y2−4z2+4xy+4xzf=-5x^2-6y^2-4z^2+4xy+4xzf=−5x2−6y2−4z2+4xy+4xz 的正定性
易得该二次型对应的矩阵表达式:f=[xyz][−5222−6020−4][xyz]f=\begin{bmatrix} x & y & z \end{bmatrix}\begin{bmatrix} -5 & 2 & 2 \\ 2 & -6 & 0 \\ 2 & 0 & -4 \end{bmatrix}\begin{bmatrix} x \\ y \\ z \end{bmatrix}f=[xyz]⎣⎡−5222−6020−4⎦⎤⎣⎡xyz⎦⎤
其中 A=[−5222−6020−4]A = \begin{bmatrix} -5 & 2 & 2 \\ 2 & -6 & 0 \\ 2 & 0 & -4 \end{bmatrix}A=⎣⎡−5222−6020−4⎦⎤
-
一阶主子式:−5<0-5 < 0−5<0
-
二阶主子式:[−522−6]=26>0\begin{bmatrix} -5 & 2 \\ 2 & -6 \end{bmatrix}=26>0[−522−6]=26>0
-
三阶主子式:[−5222−6020−4]=−80<0\begin{bmatrix} -5 & 2 & 2 \\ 2 &-6 & 0 \\ 2 & 0 & -4 \end{bmatrix}=-80 < 0⎣⎡−5222−6020−4⎦⎤=−80<0
由赫尔维茨定理易得,该二次型负定
例:设 f=x12+x22+5x32+2ax1x2−2x1x3+4x2x3f=x_1^2+x_2^2+5x_3^2+2ax_1x_2-2x_1x_3+4x_2x_3f=x12+x22+5x32+2ax1x2−2x1x3+4x2x3 为正定二次型,求 aaa 的取值范围
对于这种题最合适的方法就是赫尔维茨定理,因为带着参数值去求特征值是比较麻烦的
该二次型对应矩阵表达式为:f=[x1x2x3][1a−1a12−125][x1x2x3]f=\begin{bmatrix} x_1 & x_2 & x_3 \end{bmatrix} \begin{bmatrix} 1 & a & -1 \\ a & 1 & 2 \\ -1 & 2 & 5 \end{bmatrix}\begin{bmatrix} x_1 \\ x_2 \\ x_3 \end{bmatrix}f=[x1x2x3]⎣⎡1a−1a12−125⎦⎤⎣⎡x1x2x3⎦⎤
由该二次型为正定二次型得:
- 一阶主子式:1>01 > 01>0
- 二阶主子式:[1aa1]=1−a2>0\begin{bmatrix} 1 & a \\ a & 1 \end{bmatrix} = 1-a^2 > 0[1aa1]=1−a2>0
- 三阶主子式:∣A∣=−a(4+5a)>0|A|=-a(4+5a) > 0∣A∣=−a(4+5a)>0
即:{1−a2>0−a(4+5a)>0\begin{cases} 1-a^2 > 0 \\ -a(4+5a) > 0 \end{cases}{1−a2>0−a(4+5a)>0,解得 −45<a<0-\frac{4}{5}<a<0−54<a<0
第二个式子是一个抛物线(二次函数),可以很容易得到x轴上的两个点以及其开口向下
矩阵合同
回顾前面讲的矩阵合同和合同变换的知识:设 A,BA,BA,B 为 nnn 阶矩阵,若存在可逆矩阵 CCC,使得 B=CTACB=C^TACB=CTAC,则称 AAA 与 BBB 合同,记作 . ,这种对矩阵 AAA 的运算被称为合同变换。
根据上面的惯性定理,两矩阵合同就等价于两矩阵的正惯性指数、负惯性指数、二次型的秩都相同。
- 即充要条件:矩阵 A,BA,BA,B 合同 ↔p,q,r\leftrightarrow p,q,r↔p,q,r 相同
ppp:正惯性指数,qqq:负惯性指数,rrr:二次型的秩
f=xTAx=yTByf=x^TAx = y^TByf=xTAx=yTBy,这里矩阵 A,BA,BA,B 的关系就是合同,而将一个二次型化为一个标准型时会保持一个惯性,可以理解成,合同变换就是基于 p,q,rp,q,rp,q,r 不发生改变而完成的变换,后者是前者的充要条件。
例:设矩阵 A=[002010200],B==[10001000−1]A=\begin{bmatrix} 0&0&2\\0&1&0\\2&0&0\end{bmatrix},B==\begin{bmatrix} 1&0&0\\0&1&0\\0&0&-1\end{bmatrix}A=⎣⎡002010200⎦⎤,B==⎣⎡10001000−1⎦⎤,则两矩阵是否相似?是否合同?
- 对于矩阵 AAA:由 ∣A−λE∣=0|A-\lambda E|=0∣A−λE∣=0 得特征值为 1,2,-2;易得 p=2,q=1,r=3p=2, q=1, r=3p=2,q=1,r=3
- 对于矩阵 BBB:同理得特征值为 1,1,-1;易得 p=2,q=1,r=3p=2,q=1,r=3p=2,q=1,r=3
因此矩阵 A,BA,BA,B 合同但不相似。
特征值相同是矩阵相似的必要条件,而合同则是要看这两个矩阵的 p,q,rp,q,rp,q,r是否相同