正规矩阵

Normal Matrix 正规矩阵

正规矩阵是满足

AHA=AAH

的复方阵,其中 AH=AT共轭转置。这个条件表示 A 与自己的伴随矩阵可交换。实矩阵情形中,它退化为

ATA=AAT.

正规性不是说矩阵的元素“规整”,而是说它的谱结构可由一组正交归一特征向量完全描述。

等价刻画与域条件

在复数域上,正规矩阵的核心定理是谱定理:

AHA=AAHA 可被酉矩阵对角化.

因此正规性只对方阵定义,且本质上是复内积空间中的概念。实矩阵若满足 ATA=AAT,仍可视为复正规矩阵;但它未必能被实正交矩阵对角化,因为实旋转矩阵可能具有非实特征值。若坚持实数域,正规实矩阵一般只能正交化到由 1×1 实块和 2×2 旋转伸缩块组成的实 Schur 形式。

正规矩阵还有一个有用的范数刻画:

Ax2=AHx2对所有 x.

这来自 xHAHAx=xHAAHx。它说明正规矩阵不会像非正规矩阵那样把右作用和伴随作用的长度行为分离开。

酉对角化

正规矩阵的核心结构是酉对角化。若 ACn×n 正规,则存在 酉矩阵 U 和对角矩阵

Λ=diag(λ1,,λn)

使得

A=UΛU1=UΛUH,U1=UH.

等价地,

UHAU=Λ.

U 的列向量是一组可能为复向量的标准正交特征向量,Λ 的对角线元素是对应特征值。

唯一性体现在谱数据而不是特征向量的具体写法上。特征值的多重集合唯一;不同特征值的特征子空间彼此正交;重复特征值对应的特征子空间内部可以任选一组正交基。因此 U 通常不唯一,但谱投影

Pλ=λj=λujujH

A 唯一决定。

反过来,若某个矩阵可写成 A=UΛUHU 酉、Λ 对角,则

AH=UΛUH,

于是

AHA=UΛΛUH,AAH=UΛΛUH.

对角矩阵彼此可交换,所以 AHA=AAH。因此“正规矩阵”和“可酉对角化矩阵”是同一类对象。

与厄米矩阵

厄米矩阵 是正规矩阵的重要特例。若

A=AH,

则自动有 AHA=A2=AAH,所以 A 正规。更强的是,厄米矩阵的特征值全为实数。若 Az=λzz0,则

zHAz=λzHz,λ=zHAzzHz.

因为 A=AHzHAz 为实数,而 zHz>0,所以 λR

因此厄米矩阵的谱分解可写成

A=UΛUH,

其中 Λ 是实对角矩阵。实对称矩阵只是厄米矩阵在实数域中的特殊情形,对应 正交对角化 中的

A=QΛQT.

典型例子

厄米矩阵、反厄米矩阵和酉矩阵都是正规矩阵:

任意复对角矩阵也是正规矩阵,因为对角矩阵与其共轭对角矩阵可交换。若用任意酉矩阵 U 做酉相似变换

A=U[2000i0003+i]UH,

得到的仍是正规矩阵。这里特征值可以既非全实,也不全在单位圆上;正规性只要求存在正交归一特征向量基。

Schur 视角

Schur分解 说明任意复方阵都可写成

A=QTQH,

其中 Q 酉、T 上三角,T 的对角线是 A 的特征值。对一般矩阵,T 可能有非零上三角项,这些项记录了不能被正交特征向量基消除的耦合。

正规矩阵的特殊性在于:如果 A 正规,那么 Schur 形式中的 T 也正规;而一个上三角正规矩阵必须是对角矩阵。因此正规矩阵的 Schur 分解自动退化为酉对角化:

A=QΛQH.

这给出一个常用判别思路:一般矩阵只能保证酉三角化,正规矩阵才能保证酉对角化。

与一般对角化的区别

一般 矩阵对角化 只要求存在可逆矩阵 X

A=XΛX1.

这表示有足够多线性无关特征向量,但这些特征向量不一定正交,X1 也不一定等于 XH。正规矩阵要求更强:特征向量可以选成标准正交基,所以换基矩阵可取为酉矩阵。

例如

B=[1102]

有两个不同特征值,因此可对角化;但它通常不是正规矩阵,因为

BHBBBH.

这说明“可对角化”不等于“可酉对角化”。非正规矩阵的特征向量可能高度不正交,数值计算中也更容易受到扰动影响。

边界情形中,标量矩阵 λI 正规且任意正交基都是特征向量基,所以酉因子最不唯一;Jordan 块

[λ10λ]

除非超对角线为 0,否则不正规,因为它无法拥有完整的正交特征向量基。零矩阵既正规又厄米,也是所有特征值重合时最退化的例子。

相邻概念

酉矩阵 给出正规矩阵的正交归一特征向量基。厄米矩阵 是特征值全实的正规矩阵。傅里叶矩阵 归一化后是酉矩阵,可用来酉对角化循环矩阵。Schur分解 是从任意方阵到正规矩阵谱定理之间的桥梁:先得到三角形,再在正规条件下把三角形压缩为对角形。