投影定理

投影定理,Projection Theorem 投影定理是Hilbert空间理论中最基本且最重要的定理之一,它不仅是泛函分析的核心结果,还在最小二乘法、信号处理、优化理论、偏微分方程等领域有广泛应用。投影定理解决了最佳逼近问题:给定Hilbert空间中的一个点和闭凸集,找到该集合中与这个点最近的元素。

一、问题的提出

1.1 最佳逼近问题

H 是Hilbert空间,MH 是一个子集,xH 是一个给定点。我们想要找到 uM 使得:

xu=infvMxv

即:在 M 中找到与 x 距离最近的点 u

几何直观(在 R3 中):

1.2 为什么需要投影定理?

有限维情况Rn):

无穷维情况

二、投影定理的陈述

2.1 一般形式(闭凸集)

定理(投影定理):设 H 是Hilbert空间,MH非空闭凸集。对任意 xH

  1. 存在性:存在唯一uM 使得:

    xu=infvMxv
  2. 变分不等式(最优性条件):

    Rexu,vu0,vM
  3. 几何意义xuM "垂直"(在某种意义上)

证明(存在性):

步骤1:设 d=infvMxv,取极小化序列 {vn}n=1M 使得 xvnd

步骤2:证明 {vn} 是Cauchy序列。利用平行四边形法则:

vmvn2=(xvn)(xvm)2=2xvn2+2xvm2|(xvn)+(xvm)|2=2xvn2+2xvm24xvn+vm22

由于 M 是凸集,vn+vm2M,故:

xvn+vm22d2

因此:

vmvn22xvn2+2xvm24d20(m,n)

步骤3:由 H 的完备性,存在 uH 使得 vnu。由 M 是闭集,uM。由范数的连续性,xu=d。∎

证明(唯一性):

u1,u2M 都是最小范数解。由凸性,u1+u22M。利用平行四边形法则:

xu1+u222=(xu1)+(xu2)2214(xu12+xu22+2Rexu1,xu2)

但由于 xu1=xu2=d 是最小值,必有 xu1+u22=d,这推出 u1=u2。∎

2.2 特殊形式(闭线性子空间)

定理:设 M 是Hilbert空间 H闭线性子空间。对任意 xH,存在唯一的分解:

x=u+w,uM, wM

其中 M={zH:z,v=0,vM}M正交补

等价条件

xu,v=0,vM

xuM

证明:由闭凸集的投影定理,取 u 为最小范数解。由于 M 是线性子空间,对任意 vMαCu+αvM。由变分不等式:

Rexu,(u+αv)u=Re(αxu,v)0

由于 α 可任意取值(正负、实虚),必有 xu,v=0。∎

几何意义uxM 上的正交投影

三、正交投影算子

3.1 定义与基本性质

定义:设 M 是Hilbert空间 H 的闭线性子空间。正交投影算子 P:HM 定义为:

Px=u,其中 x=u+w, uM, wM

基本性质

定理 1:正交投影算子 P 满足:

  1. 线性性P(αx+βy)=αPx+βPy
  2. 幂等性P2=PP 是投影)
  3. 自伴性Px,y=x,Py
  4. 范数P=1(若 M{0}

证明

  1. 线性性:由投影定理,分解是线性的。

  2. 幂等性:对任意 xHPxM,故 P(Px)=Px

  3. 自伴性:设 x=u1+w1y=u2+w2uiM,wiM):

    Px,y=u1,u2+w2=u1,u2

    类似地:

    x,Py=u1+w1,u2=u1,u2
  4. 范数Pxx(由正交分解),且 PP2=P,故 P=1(当 M{0})。∎

3.2 投影算子的刻画

定理:有界线性算子 P:HH 是正交投影算子的充要条件是:

  1. P2=P(幂等)
  2. P=P(自伴)

证明

四、应用

4.1 最小二乘法

问题:给定 ACm×nbCm,求解线性方程组 Ax=b(可能无解)。

最小二乘解:求 x 使得:

Axb=minyCnAyb

几何解释

正交性条件(由投影定理):

bAx,Ay=0,yCn

等价于正规方程组

A(bAx)=0AAx=Ab

4.2 信号处理

问题:从观测信号 y(t)=s(t)+n(t) 中恢复有用信号 s(t),其中 n(t) 是噪声。

投影方法

例子:低通滤波

4.3 函数逼近

问题:给定 fL2[a,b] 和有限维子空间 M=span{ϕ1,,ϕn},求最佳逼近:

mingMfgL2

正交投影:设 {ϕ1,,ϕn} 是线性无关的,最佳逼近为:

g=i=1nciϕi

其中系数 {ci} 满足投影条件

fg,ϕj=0,j=1,,n

Galerkin方程组

i=1nciϕi,ϕj=f,ϕj,j=1,,n

写成矩阵形式:

Gc=b

其中 Gij=ϕi,ϕjGram矩阵bj=f,ϕj

特例(正交基):若 {ϕi} 是标准正交的,则:

ci=f,ϕi

这就是Fourier系数

4.4 偏微分方程

Galerkin方法:求解偏微分方程的弱解。

例子(Poisson方程):

{Δu=fin Ωu=0on Ω

弱形式:求 uH01(Ω) 使得:

Ωuvdx=Ωfvdx,vH01(Ω)

Galerkin逼近:取有限维子空间 VhH01(Ω),求 uhVh 使得:

Ωuhvhdx=Ωfvhdx,vhVh

这是在 Vh 上的正交投影问题(在能量内积下)。

4.5 统计学(回归分析)

线性回归:给定数据 (xi,yi)i=1m,拟合模型 y=β0+β1x

最小二乘估计:求 β^0,β^1 使得:

i=1m(yiβ^0β^1xi)2=minβ0,β1i=1m(yiβ0β1xi)2

矩阵形式:设 y=(y1,,ym)TX=(1x11xm)β=(β0,β1)T。则:

β^=(XTX)1XTy

这与投影定理中的正规方程组完全一致!

五、推广

5.1 斜投影

定义:设 H=MN(直和分解,不一定正交),定义斜投影算子 P:HM 为:

Px=m,其中 x=m+n, mM, nN

性质

5.2 Banach空间的度量投影

问题:在Banach空间中,最佳逼近问题更复杂:

例子:在 L1 空间中,最佳逼近可能不唯一。


参考链接

参考文献

  1. Rudin, W. (1991). Functional Analysis (2nd ed.). McGraw-Hill.
  2. Lax, P. D. (2002). Functional Analysis. Wiley-Interscience.
  3. Kreyszig, E. (1978). Introductory Functional Analysis with Applications. Wiley.
  4. Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.

AI 结构化补充(2026-05-02)

定理陈述

Projection Theorem 投影定理说明:在带有内积的空间中,把一个向量投到一个闭线性子空间上,等价于把它分解成“子空间内的最近点”和“垂直于该子空间的误差”。有限维线性代数中的投影、正规方程和最小二乘,都是这个定理的具体形式。

S 是内积空间中的线性子空间,b 是给定向量。若存在

b=p+e,pS,eS,

p 称为 bS 上的正交投影。这个 pS 中离 b 最近的唯一向量:

bp=minySby.

反过来,若 pS 是最近点,则误差

e=bp

必须满足

eS.

在有限维空间中,每个子空间都是闭的,因此上述结论总可用于直线、平面和列空间。若在 Hilbert 空间中工作,则需要 S 是闭子空间;不闭的子空间可能只有距离下确界,而没有真正达到下确界的最近点。

最近点与正交误差

投影定理的几何核心是一条勾股分解。若 pSe=bpS,任取 yS,则

by=e+(py).

因为 pySeS,有

by2=e2+py2e2.

等号当且仅当 y=p。所以正交误差条件不仅说明 p 是一个候选点,而且直接证明 p 是最近点。

最近点也反推出正交误差。若 p 是最近点,对任意 vS 考察

f(t)=b(p+tv)2=etv2.

t=0 是最小点,因此

f(0)=2eTv=0.

由于 v 任意,得到 eS。这说明正交误差不是额外性质,而是最佳逼近的等价刻画。

列空间形式

A=[a1  an]Rm×n,

目标子空间为列空间 C(A)。投影点一定可以写成

p=Ax^.

误差为

e=bAx^.

投影定理要求 e 垂直于 C(A),也就是垂直于 A 的每一列:

AT(bAx^)=0.

这就是正规方程

ATAx^=ATb.

A 的列线性无关时,ATA 可逆,因而

x^=(ATA)1ATb,

并且

p=Ax^=A(ATA)1ATb.

把乘在 b 前面的线性算子单独写出,得到

P=A(ATA)1AT,p=Pb.

这个矩阵的列空间就是目标空间 C(A);当 An 个线性无关列时,rankP=n

线投影是这个公式的 n=1 情形。若 A 只有一列 a,则

p=aaTbaTa.

这正是向量投影中的直线投影公式。

ATA 的可逆边界

公式

x^=(ATA)1ATb

的前提不是 A 是方阵,而是 A 的列向量线性无关。关键事实是

N(ATA)=N(A).

一方面,若 Ax=0,则自然有 ATAx=0。另一方面,若

ATAx=0,

左乘 xT

xTATAx=(Ax)T(Ax)=Ax2=0,

所以 Ax=0。因此两者零空间相同。

于是

ATA 可逆N(ATA)={0}N(A)={0}A 列线性独立.

若列向量相关,正规方程仍能表达正交条件,但不能直接用 (ATA)1 写出唯一系数;应改用列空间的一组基、QR 分解、SVD 或 Moore-Penrose 伪逆。

这里不能把 (ATA)1 误拆成 A1(AT)1。列空间投影中的 A 通常是矩形矩阵,没有 A1;如果 A 恰好是方阵且可逆,那么 C(A)=Rm,投影矩阵确实是 I,误差也确实是 0,但那已经是特殊满空间情形。

投影矩阵与互补分解

A 列满秩时,投影到 C(A)投影矩阵

P=A(ATA)1AT.

对任意 b

p=Pb,e=bp=(IP)b.

这个矩阵满足

P2=P,PT=P.

幂等性来自“已经在 C(A) 中的向量再投影仍是自己”,对称性来自正交投影的误差方向。互补算子也满足

(IP)2=IP,(IP)T=IP,

并且把向量投到

C(A)=N(AT).

因此每个向量都有正交分解

b=Pb+(IP)b,

两部分分别属于 C(A)C(A)

边界情形也由此统一:若 C(A)=Rm,则 P=I、误差为零;若 C(A)={0},则 P=0、整个 b 都是误差;若 bC(A),则 Pb=b;若 bC(A),则 Pb=0

例子

b=[234]

投影到 z 轴和 xy 平面上,得到

p1=[004],p2=[230].

对应矩阵为

P1=[000000001],P2=[100010000].

它们满足

P12=P1,P22=P2,P1+P2=I.

z 轴与 xy 平面互为正交补,所以这两个投影把同一个向量拆成两个正交分量。

再看列空间例子:

A=[101112],b=[600].

先计算

ATA=[3335],ATb=[60].

由正规方程可得

x^=[53],p=Ax^=[521],e=bp=[121].

也就是 p=(5,2,1)Te=(1,2,1)T
误差与 A 的两列都正交:

[111]Te=0,[012]Te=0.

pC(A) 中离 b 最近的点。对应的投影矩阵为

P=16[521222125],

并且 Pb=p(IP)b=e

理论位置

投影定理把正交投影、正交误差、投影矩阵和最小二乘法连接在一起。几何上,它说最近点由垂直误差刻画;代数上,它给出正规方程;矩阵上,它给出 P=A(ATA)1AT;泛函分析中,它进一步推广为 Hilbert 空间闭凸集上的最佳逼近定理。

对闭凸集 M,最近点仍唯一,但正交性改写为变分不等式:

Rebp,yp0,yM.

M 是线性子空间时,yp 可沿正负方向任意变化,这个不等式就退化为严格的正交条件。