二次型

核心问题

二次型研究的是形如 的二次表达式。它把“多元二次函数的形状”转化为“对称矩阵的性质”,所以要和矩阵的特征值和特征向量正交矩阵相似矩阵与矩阵可对角化的条件一起看。

一、二次型的定义

含有 个变量 的二次齐次多项式

称为一个 元二次型。

通常把交叉项平均分配到对称位置,写成矩阵形式:

其中 ,称为二次型 的矩阵。

例:

对应矩阵为

因为交叉项 来自

二、合同变换

,其中 可逆,则

矩阵 变为

合同。

与相似的区别

相似变换是 ,保持特征值;合同变换是 ,用于化二次型标准形。二者都在“换坐标”,但保留的性质不同。

三、标准形与规范形

若通过可逆线性替换把二次型化为

则称为二次型的标准形。

若进一步把非零系数化为

称为规范形。

  • 正平方项个数 称为正惯性指数。
  • 负平方项个数 称为负惯性指数。
  • 非零平方项个数 等于二次型矩阵的秩。

四、化标准形的方法

1. 配方法

适合低阶、手算题。

基本思路:

  1. 先找平方项。
  2. 把含某个变量的一组项配成完全平方。
  3. 对剩余变量继续处理。

2. 初等变换法

对矩阵 做成对的行列变换:

  • 对第 行做某个初等行变换,同时对第 列做对应的初等列变换。
  • 这样保持合同关系。
  • 最终把 化为对角矩阵,对角元就是标准形系数。

3. 正交变换法

如果 是实对称矩阵,则存在正交矩阵 ,使得

其中 是由特征值组成的对角矩阵。

这说明二次型可通过正交变换化为

参见正交矩阵矩阵的特征值和特征向量

五、正定二次型

二次型 称为正定,如果对任意非零向量 ,都有

常见判别方法:

判别角度正定条件
特征值 的全部特征值大于
顺序主子式 的所有顺序主子式均大于
标准形标准形中所有非零系数为正,且秩为

负定类似:全部特征值小于 ;顺序主子式符号满足

六、与应用的连接

  • 多元函数的极值及其求法中,二阶泰勒展开的主部就是二次型,Hessian 矩阵正定通常对应局部极小。
  • 在最小二乘、回归、机器学习中,损失函数常含 ,正定性决定唯一最优解和曲面形状。
  • 在几何中,二次型描述椭圆、双曲面等二次曲面的主轴方向;主轴方向由特征向量给出。

七、做题检查表

  • 先把二次型写成 ,注意交叉项系数要平分。
  • 问标准形:优先配方法或成对初等变换。
  • 问正定性:优先顺序主子式;若已知特征值,则直接看特征值符号。
  • 问几何意义:联系矩阵的特征值和特征向量,特征向量给主轴方向,特征值给伸缩强度。