对称矩阵

Symmetric Matrices
在线性代数的理论和应用中具有很重要的地位,最为重要的一类矩阵

由对称矩阵和标准正交矩阵的性质知道:S=ST,QT=Q1
Λ :特征值为实数的对角阵
Q :特征向量为标准正交基的矩阵

则对称矩阵矩阵可以对角化分解为:

S=QΛQ1=QΛQTS=QΛQT=(q1qn)(λ1λn)(q1TqnT)=λ1q1q1T++λnqnqnTSqi=(λ1q1q1T++λnqnqnT)qi=λiqi

非对称阵如果特征值为特征方程的重根,则不一定有完全线性独立的特征向量,也就是说不一定可以对角化,但是对称矩阵一定可以对角化

二次型

二次型紧密相关

矩阵的正定性

希尔维斯特判据:
正定:矩阵的各阶主子式均大于零

定义

正定矩阵 Positive Definite Matrix
正定矩阵是对称矩阵的一个特例,具有一些良好的性质,使得它在理论和实际问题中都非常有用。
特征值全为正数的对称矩阵(all λ>0)

半正定矩阵 PSD Positive Semidefinite Matrix
正定矩阵概念的扩展。

负定矩阵

半负定矩阵

判别方法

重要应用

检验是否有最小值


AI 结构化补充(2026-05-02)

Symmetric Matrices
对称矩阵是满足

A=AT

的方阵,也就是主对角线两侧的元素互为镜像:aij=aji。它不是普通方阵的一个小修饰,而是把行结构和列结构绑定在一起的矩阵类型;许多关于长度、夹角、能量和曲率的问题最终都会落到对称矩阵上。

基本性质

对称矩阵首先必须是方阵。若 A=ATA 可逆,则

(A1)T=(AT)1=A1,

所以可逆对称矩阵的逆仍然对称。

任意矩阵都能自然产生对称矩阵。只要乘积有意义,

(ATA)T=ATA,(AAT)T=AAT.

因此 ATAAAT 总是对称的,即使 A 本身是长方形矩阵。ATA 记录 A 的列向量两两内积,AAT 记录 A 的行向量两两内积;它们通常不是同一个矩阵,维度也可能不同。

这种构造解释了为什么最小二乘、Gram 矩阵、正交投影和很多能量模型都反复出现 ATA:它把一个一般线性映射转成了可由内积解释的对称对象。

有限维谱结构

实对称矩阵的特殊性可以概括为两点:全部特征值为实数,并且可以选出一组正交归一特征向量。因此对称矩阵的对角化不是一般的 XΛX1,而是正交对角化:

S=QΛQT,QTQ=I.

这里 Q 的列向量 q1,,qn 是单位正交特征向量,Λ 是实特征值对角矩阵。展开成秩一投影的形式就是

S=λ1q1q1T++λnqnqnT.

每个 qiqiT 把向量投影到第 i 个主方向,λi 给出该方向上的伸缩系数。非对称矩阵即使有重特征值,也不一定有足够多的线性无关特征向量;实对称矩阵则总能正交对角化。

一个典型的二阶例子是

S=(1224).

其特征多项式为

det(SλI)=λ25λ,

所以特征值是 λ=0,5。可取对应特征向量

x0=(21),x5=(12),

并且 x0Tx5=0。归一化后,

q0=15(21),q5=15(12),

于是

Q=15(2112),Λ=(0005),S=QΛQT.

这个例子也说明了为什么对称性会强迫正交性:λ=0 的特征向量在零空间中,λ=5 的特征向量在列空间中;对称矩阵的行空间与列空间相同,而零空间垂直于行空间。

复数边界

实对称矩阵有实特征值,但这个结论不能推广到所有实矩阵。对任意实矩阵,若存在复特征值

λ=a+ib,

则其共轭

λ=aib

也会作为特征值出现,对应特征向量也成共轭对。二维旋转矩阵就是最简单的提醒:

Rθ=(cosθsinθsinθcosθ)

的特征值为

λ1=cosθ+isinθ,λ2=cosθisinθ.

因此“实矩阵”本身并不保证实谱;真正关键的是对称性。进入复矩阵时,正确的对应条件也不是单纯的 ST=S,而是 Hermitian 条件

S=ST.

相对地,实反对称矩阵 A=AT 的特征值会落在纯虚方向上。
这类反对称矩阵在复内积下仍可选出正交归一的复特征向量,但其特征值不再是实数。

二次型入口

对称矩阵与二次型一一对应。给定实对称矩阵 S,二次型是

q(x)=xTSx.

反过来,一个实二次型中的交叉项可以唯一归入对称矩阵:xixjxjxi 合并后放到 sij=sji。因此二次型天然只看矩阵的对称部分。对任意实矩阵 M

xTMx=xT(M+MT2)x.

反对称部分在二次型中会相互抵消。

正定性就是从二次型进入对称矩阵的核心入口:

S0xTSx>0(x0).

S=QΛQT,则 xTSx=iλizi2,其中 z=QTx。所以正定等价于所有特征值为正;半正定等价于所有特征值非负。希尔维斯特判据则给出另一种判别方式:实对称矩阵正定当且仅当所有顺序主子式均大于零。

消元与 LDLT

普通消元把矩阵写成 A=LDUA=LU,但这个形式会隐藏对称性。若 S=ST,并且消元过程中不需要行交换,则

S=LDLT.

这里 L 是单位下三角矩阵,D 是由主元组成的对角矩阵,最后一个因子不是独立的 U,而是 LT。原因是对称矩阵的上三角部分由下三角部分转置得到;消元乘子写进 L 后,右侧对应部分自动是 LT

这个分解保留了对称矩阵的结构:

(LDLT)T=LDTLT=LDLT.

由于 D 本身对称,整个乘积必然对称。计算上,LDLT 只需存储 LD,不必额外存储一个独立的 U;理论上,它也把主元符号直接暴露出来,方便判断正定、不定和半正定情形。

对实对称矩阵,主元符号和特征值符号还有更强的对应关系:在无零主元的 LDLT 分解下,正特征值的个数等于正主元的个数,负特征值的个数也相应匹配。直观证明是把

S=LDLT

中的 L 连续变到 I,矩阵从 LDLT 连续变为 D。特征值在这个过程中连续移动;只要主元不为零,矩阵不经过奇异状态,特征值就不能穿过 0 改变符号。因此对称矩阵的谱符号可以通过消元主元读出。特别地,

λi>0 对所有 i所有主元都为正.

正定矩阵

正定矩阵 Positive Definite Matrix 是对称矩阵中二次型始终为正的一类:

xTSx>0(x0).

它等价于所有特征值为正,也等价于 LDLT 分解中的对角主元全为正。半正定矩阵 PSD Positive Semidefinite Matrix) 则允许 xTSx=0 出现在非零方向上,对应特征值非负。

正定矩阵的重要应用是判定能量、距离、方差和局部最小值。在多元微积分中,Hessian 矩阵若在驻点处正定,则该点是严格局部最小值;若不定,则存在上升和下降方向。

相邻概念

对称矩阵连接矩阵转置二次型矩阵对角化、正交投影和最小二乘。ATA 是列向量 Gram 矩阵,AAT 是行向量 Gram 矩阵;LDLT 则是对称矩阵在消元中的结构化形式。谱分解偏重几何主方向,LDLT 偏重计算过程,二次型偏重能量和正定性。