Eigenvalues and Eigenvectors
一、基本定义和几何意义
为特征值 为特征向量
直观上的理解:当矩阵作用于向量时,大多数向量会改变方向,但是有某些向量不会改变方向,而只是在同一方向上伸缩。其中:不改变方向的向量为特征向量,伸缩的倍数为特征值。
二、计算特征值和特征向量
特征方程:
特征多项式:
-
从线性方程组的角度看:特征方程实质上为齐次线性方程组,有非零解的充分必要条件是系数行列式 为 0,可以求得特征值、进而求的特征向量
-
从向量空间的角度看:特征向量 在 的零空间中,如果 为矩阵 的一个特征值, 则 可以求得非零解 ,求得的解向量为 对应的特征向量
三、迹和行列式
可以通过矩阵本身,快速得到特征值的和与积
实矩阵的复数特征值
如果矩阵有复数的特征值,则特征值一定共轭。
设特征值为
实际应用
最重要的应用: 矩阵对角化
稳定性分析:在控制理论中,系统稳定性的分析依赖于系统矩阵的特征值的实部。
数据降维:主成分分析(PCA)中,特征向量帮助确定数据的主要变化方向。
AI 结构化补充(2026-05-02)
Eigenvalues and Eigenvectors
一、基本定义和几何意义
为特征值 为特征向量
严格说, 必须是方阵,且 ;零向量虽然满足许多齐次等式,但不作为特征向量。
直观上的理解:当矩阵作用于向量时,大多数向量会改变方向,但是有某些向量不会改变方向,而只是在同一方向上伸缩。其中:不改变方向的向量为特征向量,伸缩的倍数为特征值。
二、计算特征值和特征向量
特征方程:
特征多项式:
-
从线性方程组的角度看:特征方程实质上为齐次线性方程组,有非零解的充分必要条件是系数行列式 为 0,可以求得特征值、进而求的特征向量
-
从向量空间的角度看:特征向量 在 的零空间中,如果 为矩阵 的一个特征值, 则 可以求得非零解 ,求得的解向量为 对应的特征向量
三、迹和行列式
可以通过矩阵本身,快速得到特征值的和与积
实矩阵的复数特征值
如果矩阵有复数的特征值,则特征值一定共轭。
设特征值为
实际应用
最重要的应用: 矩阵对角化
稳定性分析:在控制理论中,系统稳定性的分析依赖于系统矩阵的特征值的实部。
数据降维:主成分分析(PCA)中,特征向量帮助确定数据的主要变化方向。
计算路线与快速校验
特征值问题的几何起点是
特征值 描述该方向被拉伸、压缩、反向或压到零;当 时,对应特征向量就在 的零空间中。计算时先解
得到特征值,再把每个根代回 求对应特征向量。迹与行列式提供快速校验:特征值之和等于 ,特征值之积等于 。
不变方向的运算规则
若
则同一个特征向量方向在若干常见矩阵运算下保持不变:
其中 这一条要求 可逆,也等价于这个特征值不为 。更一般地,矩阵的高次幂不会混合已经分解到特征向量方向上的分量;每个方向只被自己的特征值反复缩放。因此特征值问题把复杂的向量演化拆成若干一维伸缩。
Markov 矩阵中的稳定方向
设
它的特征方程为
所以特征值为 与 。对应特征向量可取
是稳定方向,因为 ; 是衰减方向,因为 。第一列可以写成
于是
这解释了为什么高次幂的列趋近于同一个稳定向量:
投影、反射与零特征值
投影矩阵的特征值只可能是 或 。例如
满足
因此 的特征向量填满投影保留的列空间, 的特征向量填满被压到零的零空间。反射矩阵
有相同的两个特征向量,但特征值变为 与 :方向 不变,方向 被反向。
零特征值没有特殊禁忌。它的含义只是存在非零向量 使 ,即 在零空间中;因此方阵奇异当且仅当 是一个特征值。
奇异矩阵例子
对
有
所以特征值为 与 。对应特征向量可取
这里 来自矩阵本身奇异, 来自平移后的矩阵 奇异。任一特征向量的非零倍数仍是同一特征值的特征向量。
AB 与 A+B 的常见误区
一般不能把 与 的特征值直接相乘得到 的特征值,也不能直接相加得到 的特征值。问题出在特征向量不一定共享。
若 同时满足
则
并且
但这只对同一个公共特征向量成立。反例是
与 的特征值全为 ,可是
分别出现特征值 ,以及 。如果 与 有一组共同的 个线性无关特征向量,则可以在这些方向上逐一相乘或相加特征值,这正是共同特征向量条件的意义。
基与对角化的边界
特征向量最有用的情形,是它们组成一组基。这样任意向量都可以分解到特征方向上,矩阵的幂、逆和平移都按一维规则处理。若一个 矩阵只有一条特征向量直线,即使代数上有重特征值,也不能得到完整特征向量基,因而不能直接对角化。单位矩阵是相反的极端:它的特征值全为 ,但每个非零向量都是特征向量。