第七章 线性变换
本章包含线性变换与矩阵的对应、特征值与特征向量、对角化及若尔当标准形相关的基础定理。
定义7.1 线性变换
设 V 是数域 P 上的线性空间,A 是 V 到自身的映射。如果对任意 α,β∈V 和 k∈P,有
A(α+β)=Aα+Aβ,A(kα)=kAα,
则称 A 为 V 上的线性变换。
例子:定义7.1 线性变换 — 例子
定义7.2 线性变换的矩阵
设 ε1,ε2,…,εn 是 V 的一组基,A 是 V 上的线性变换。若
Aεj=i=1∑naijεi(j=1,2,…,n),
即
(Aε1,Aε2,…,Aεn)=(ε1,ε2,…,εn)A,
则 A=(aij) 称为 A 在基 ε1,ε2,…,εn 下的矩阵。
例子:定义7.2 线性变换的矩阵 — 例子
定义7.3 特征值与特征向量
设 A 是数域 P 上线性空间 V 的线性变换。如果存在 λ0∈P 和非零向量 ξ∈V,使得
Aξ=λ0ξ,
则称 λ0 为 A 的一个特征值,ξ 为 A 的属于特征值 λ0 的一个特征向量。
例子:定义7.3 特征值与特征向量 — 例子
定义7.4 特征多项式
设 A 是 n 阶方阵,称
f(λ)=∣λE−A∣
为 A 的特征多项式。特征多项式的根即为矩阵 A 的特征值。
例子:定义7.4 特征多项式 — 例子
定义7.5 特征子空间
设 λ0 是线性变换 A 的特征值,称
Vλ0={ξ∈V∣Aξ=λ0ξ}
为 A 的属于特征值 λ0 的特征子空间。
例子:定义7.5 特征子空间 — 例子
定义7.6 可对角化
如果线性变换 A(或矩阵 A)在某组基下的矩阵为对角矩阵,则称 A(或 A)可对角化。
例子:定义7.6 可对角化 — 例子
定义7.7 不变子空间
设 A 是线性空间 V 上的线性变换,W 是 V 的子空间。如果对任意 α∈W,都有 Aα∈W,则称 W 为 A 的不变子空间。
例子:定义7.7 不变子空间 — 例子
定义7.8 最小多项式
设 A 是 n 阶方阵。满足 f(A)=0 的次数最低的首一多项式 f(λ) 称为 A 的最小多项式。
例子:定义7.8 最小多项式 — 例子
定义7.9 若尔当标准形
形如
Jk(λ)=λ1λ⋱⋱1λk×k
的矩阵称为 k 阶若尔当块。由若干个若尔当块组成的准对角矩阵称为若尔当标准形(或若尔当矩阵)。
定理7.1 线性变换由基上的像唯一确定
设 ε1,ε2,…,εn 是线性空间 V 的一组基,α1,α2,…,αn 是 V 中任意 n 个向量。存在唯一的线性变换 A,使
Aεi=αi,i=1,2,…,n.
证
存在性:对任意 ξ∈V,ξ 可唯一地表示为 ξ=∑i=1nxiεi。定义 Aξ=∑i=1nxiαi。
验证线性:设 ξ=∑xiεi,η=∑yiεi,则
A(ξ+η)=A(∑(xi+yi)εi)=∑(xi+yi)αi=∑xiαi+∑yiαi=Aξ+Aη。
A(kξ)=A(∑kxiεi)=∑kxiαi=k∑xiαi=kAξ。
且 Aεi=αi(取 ξ=εi,坐标为 xj=δij)。
唯一性:设 B 也是线性变换且 Bεi=αi。对任意 ξ=∑xiεi,Bξ=∑xiBεi=∑xiαi=Aξ,故 B=A。
证毕
例子:定理7.1 线性变换的矩阵表示 — 例子
定理7.2 线性变换与矩阵的对应保持运算
设 ε1,ε2,…,εn 是数域 P 上 n 维线性空间 V 的一组基,在这组基下,每个线性变换按公式对应一个 n×n 矩阵。这个对应具有以下的性质:
- 线性变换的和对应于矩阵的和;
- 线性变换的乘积对应于矩阵的乘积;
- 线性变换的数量乘积对应于矩阵的数量乘积;
- 可逆的线性变换与可逆矩阵对应,且逆变换对应于逆矩阵。
证
设 Aεj=∑i=1naijεi(矩阵 A),Bεj=∑i=1nbijεi(矩阵 B)。
1:(A+B)εj=Aεj+Bεj=∑(aij+bij)εi,对应矩阵 A+B。
2:(AB)εj=A(Bεj)=A(∑k=1nbkjεk)=∑k=1nbkjAεk=∑k=1nbkj∑i=1naikεi=∑i=1n(∑k=1naikbkj)εi,对应矩阵 AB。
3:(kA)εj=k(Aεj)=k∑aijεi=∑(kaij)εi,对应矩阵 kA。
4:若 A 可逆,设逆变换为 A−1,对应矩阵 C。则 AA−1=E,由2,AC=E,故 C=A−1。反之,若 A 可逆,由对应关系存在线性变换 B 对应 A−1,则 AB 对应 AA−1=E,即 AB=E,A 可逆。
证毕
例子:定理7.2 线性变换在不同基下的矩阵 — 例子
定理7.3 向量坐标的计算
设线性变换 A 在基 ε1,ε2,…,εn 下的矩阵是 A,向量 ξ 在基 ε1,ε2,…,εn 下的坐标是 (x1,x2,…,xn),则 Aξ 在基 ε1,ε2,…,εn 下的坐标 (y1,y2,…,yn) 可以按公式
y1y2⋮yn=Ax1x2⋮xn
计算。
证
ξ=∑j=1nxjεj,Aξ=∑j=1nxjAεj=∑j=1nxj∑i=1naijεi=∑i=1n(∑j=1naijxj)εi。
因此 yi=∑j=1naijxj,即 Y=AX。
证毕
例子:定理7.3 相似矩阵的性质 — 例子
定理7.4 线性变换在不同基下矩阵的关系
设线性空间 V 中线性变换 A 在两组基 ε1,ε2,…,εn 和 η1,η2,…,ηn 下的矩阵分别为 A 和 B,从基 ε 到 η 的过渡矩阵是 X,于是
B=X−1AX.
证
由定义,Aεj=∑i=1naijεi(矩阵 A),Aηj=∑i=1nbijηi(矩阵 B),(η1,…,ηn)=(ε1,…,εn)X。
设 X 的第 j 列为 (x1j,…,xnj)T,则 ηj=∑k=1nxkjεk。
Aηj=∑k=1nxkjAεk=∑k=1nxkj∑i=1naikεi=∑i=1n(∑k=1naikxkj)εi。
另一方面,Aηj=∑i=1nbijηi=∑i=1nbij∑k=1nxkiεk=∑k=1n(∑i=1nxkibij)εk。
比较系数,∑kaikxkj=∑i′xii′bi′j,即 AX=XB,故 B=X−1AX。
证毕
例子:定理7.4 特征值与特征向量 — 例子
定理7.5 线性变换与矩阵相似的对应
线性变换在不同基下所对应的矩阵是相似的。反过来,如果两个矩阵相似,那么它们可以看作同一个线性变换在两组基下所对应的矩阵。
证
前半部分:由定理7.4,B=X−1AX,X 可逆,故 A 与 B 相似。
后半部分:设 B=X−1AX,X 可逆。在 n 维空间 V 中取基 ε1,…,εn,定义线性变换 A 使其在 ε 下的矩阵为 A。令 η1,…,ηn 满足 (η1,…,ηn)=(ε1,…,εn)X,则 η 也是一组基(X 可逆)。由定理7.4,A 在 η 下的矩阵为 X−1AX=B。
证毕
例子:定理7.5 特征多项式的性质 — 例子
定理7.6 相似矩阵的特征多项式
相似的矩阵有相同的特征多项式。
证
设 B=X−1AX,则 ∣λE−B∣=∣λE−X−1AX∣=∣X−1(λE−A)X∣=∣X−1∣⋅∣λE−A∣⋅∣X∣=∣λE−A∣。
证毕
例子:定理7.6 哈密顿-凯莱定理 — 例子
哈密顿-凯莱(Hamilton-Cayley)定理
设 A 是数域 P 上一 n×n 矩阵,f(λ)=∣λE−A∣ 是 A 的特征多项式,则
f(A)=An−(a11+a22+⋯+ann)An−1+⋯+(−1)n∣A∣E=O.
推论:设 A 是有限维空间 V 的线性变换,f(λ) 是 A 的特征多项式,那么 f(A)=0。
证
设 f(λ)=∣λE−A∣。令 B(λ)=(λE−A)∗ 为 λE−A 的伴随矩阵。B(λ) 的每个元素是 λE−A 的 n−1 阶子式,故是 λ 的次数不超过 n−1 的多项式。设
B(λ)=B0λn−1+B1λn−2+⋯+Bn−1,
其中 Bi 是 n×n 常数矩阵。
由伴随矩阵的性质,(λE−A)B(λ)=∣λE−A∣E=f(λ)E。
设 f(λ)=λn+c1λn−1+⋯+cn,则
(λE−A)(B0λn−1+B1λn−2+⋯+Bn−1)=(λn+c1λn−1+⋯+cn)E.
比较两边 λk 的系数:
λn:B0=E;
λn−1:B1−AB0=c1E,即 B1=AB0+c1E=A+c1E;
λk(0⩽k⩽n−2):Bn−k−ABn−k−1=cn−kE;
λ0:−ABn−1=cnE。
将第 k 式左乘 Ak(k=0,1,…,n),然后全部相加:
A0B0+A1(B1−AB0)+A2(B2−AB1)+⋯+An(−ABn−1)=c0E+c1A+⋯+cnAn。
左边逐项消去后等于零,右边为 f(A)。故 f(A)=O。
推论:A 在某基下对应矩阵 A,f(A) 对应 f(A)=O,零矩阵对应零变换,故 f(A)=0。
证毕
定理7.7 可对角化的充要条件
设 A 是 n 维线性空间 V 的一个线性变换,A 的矩阵可以在某一组基下为对角矩阵的充分必要条件是,A 有 n 个线性无关的特征向量。
证
充分性:设 α1,…,αn 是 A 的 n 个线性无关的特征向量,Aαi=λiαi。取 α1,…,αn 为 V 的基,则 A 在此基下的矩阵为 diag(λ1,…,λn),是对角矩阵。
必要性:设 A 在基 η1,…,ηn 下的矩阵为对角矩阵 diag(λ1,…,λn),则 Aηi=λiηi,每个 ηi 都是特征向量,且基向量线性无关,故有 n 个线性无关的特征向量。
证毕
例子:定理7.7 对角化的充要条件 — 例子
定理7.8 不同特征值的特征向量线性无关
属于不同特征值的特征向量是线性无关的。
推论1:如果在 n 维线性空间 V 中,线性变换 A 的特征多项式在数域 P 中有 n 个不同的根,即 A 有 n 个不同的特征值,那么 A 在某组基下的矩阵是对角形的。
推论2:在复数域上的线性空间中,如果线性变换 A 的特征多项式没有重根,那么 A 在某组基下的矩阵是对角形的。
证
对特征值个数 k 做归纳法。k=1 时,一个非零特征向量自然线性无关。
设 k−1 个不同特征值的特征向量线性无关。设 α1,…,αk 分别属于不同特征值 λ1,…,λk,且
c1α1+c2α2+⋯+ckαk=0.
用 A 作用:c1λ1α1+c2λ2α2+⋯+ckλkαk=0。
第一式乘以 λk 减去第二式:c1(λk−λ1)α1+⋯+ck−1(λk−λk−1)αk−1=0。
由归纳假设,α1,…,αk−1 线性无关,故 ci(λk−λi)=0(i=1,…,k−1)。因为 λk=λi,故 ci=0(i=1,…,k−1)。代入第一式得 ckαk=0,αk=0,故 ck=0。
推论1:n 个不同特征值各有一个特征向量,由本定理这 n 个特征向量线性无关,由定理7.7,A 可对角化。
推论2:复数域上特征多项式必有 n 个根,无重根则 n 个不同特征值,由推论1得证。
证毕
例子:定理7.8 不变子空间 — 例子
定理7.9 不同特征值的特征向量组合
如果 λ1,…,λk 是线性变换 A 的不同的特征值,而 αi1,…,αiri(i=1,2,…,k)是属于特征值 λi 的线性无关的特征向量,那么向量组 α11,…,α1r1,…,αk1,…,αkrk 也线性无关。
证
对 k 做归纳法。k=1 时结论显然。
设对 k−1 个特征值结论成立。设
i=1∑kj=1∑ricijαij=0.
令 βi=∑j=1ricijαij(i=1,…,k),则 ∑i=1kβi=0。
若某个 βi=0,则 βi 是属于 λi 的特征向量(因为 αi1,…,αiri 都属于 λi)。此时非零的 βi 分别属于不同特征值,由定理7.8它们线性无关,不可能组合为零,矛盾。故所有 βi=0。
由 βi=0,即 ∑j=1ricijαij=0,而 αi1,…,αiri 线性无关,故 cij=0。对所有 i 都成立。
证毕
例子:定理7.9 值域与核 — 例子
定理7.10 线性变换的秩与矩阵的秩
线性变换的秩等于其对应矩阵的秩。
证
设 A 在基 ε1,…,εn 下的矩阵为 A。AV 由 Aε1,…,Aεn 生成,而 Aεj=∑i=1naijεi,故 Aεj 在基下的坐标就是 A 的第 j 列。
AV 的维数 = Aε1,…,Aεn 中极大线性无关组的向量个数 = A 的列秩 = A 的秩。
证毕
例子:定理7.10 线性变换的秩与零度 — 例子
定理7.11 秩与零度之和
设 A 是 n 维线性空间 V 的线性变换。则 AV 的一组基的原像及 A−1(0) 的一组基合起来就是 V 的一组基。由此还有
A的秩+A的零度=n.
推论:对于有限维线性空间的线性变换,它是单射的充分必要条件为它是满射。
证
设 AV 的维数为 r,取基 η1,…,ηr。对每个 ηi,取 ξi∈V 使 Aξi=ηi。
设 A−1(0) 的维数为 s,取基 ζ1,…,ζs。
断言:ξ1,…,ξr,ζ1,…,ζs 是 V 的基。
先证线性无关:设 ∑i=1raiξi+∑j=1sbjζj=0。用 A 作用:∑i=1raiηi=0(因为 Aζj=0)。η1,…,ηr 线性无关,故 ai=0。于是 ∑bjζj=0,ζ1,…,ζs 线性无关,故 bj=0。
再证生成:对任意 α∈V,Aα∈AV,可表为 Aα=∑i=1rciηi=A(∑ciξi)。故 A(α−∑ciξi)=0,即 α−∑ciξi∈A−1(0),可由 ζ1,…,ζs 表出。故 α 可由 ξ1,…,ξr,ζ1,…,ζs 表出。
因此 n=r+s,即秩 + 零度 =n。
推论:A 单射 ⇔ A−1(0)={0} ⇔ 零度 =0 ⇔ 秩 =n ⇔ AV=V ⇔ A 满射。
证毕
例子:定理7.11 线性变换可逆的充要条件 — 例子
定理7.12 不变子空间的直和分解
设线性变换 A 的特征多项式为 f(λ),它可分解成一次因式的乘积
f(λ)=(λ−λ1)r1(λ−λ2)r2…(λ−λs)rs,
则 V 可分解成不变子空间的直和
V=V1⊕V2⊕⋯⊕Vs,
其中 Vi={ξ∈V∣(A−λiE)riξ=0}。
证
令 fi(λ)=(λ−λi)rif(λ)=∏j=i(λ−λj)rj。则 f1,f2,…,fs 互素,故存在多项式 u1(λ),…,us(λ) 使
u1(λ)f1(λ)+⋯+us(λ)fs(λ)=1.
令 Ei=ui(A)fi(A),则 E1+⋯+Es=E(恒等变换)。
对任意 ξ∈V,ξ=E1ξ+⋯+Esξ。而 Eiξ=ui(A)fi(A)ξ∈Vi,因为 (A−λiE)riEiξ=ui(A)(A−λiE)rifi(A)ξ=ui(A)f(A)ξ=0(由哈密顿-凯莱定理)。
故 V=V1+V2+⋯+Vs。
再证是直和:若 α1+⋯+αs=0(αi∈Vi),则 fi(A)αi=0(因为 (λ−λi)ri∣fi(λ)⋅(λ−λi)ri 不对,但 fi(A)αi:由 αi∈Vi,(A−λiE)riαi=0,而 fi(λ) 与 (λ−λi)ri 互素,故存在 p,q 使 pfi+q(λ−λi)ri=1,p(A)fi(A)αi+q(A)(A−λiE)riαi=αi,第二项为零,故 αi=p(A)fi(A)αi)。
对 α1+⋯+αs=0,用 fj(A) 作用(j=i):fj(A)αi=0(当 i=j 时,fj 含因子 (λ−λi)ri,故 fj(A) 作用在 Vi 上为零),故 fj(A)αj=0。但 fj(λ) 与 (λ−λj)rj 互素,由上述论证,αj=0。直和得证。
每个 Vi 是 A 的不变子空间:若 ξ∈Vi,(A−λiE)riξ=0,则 (A−λiE)riAξ=A(A−λiE)riξ=0,故 Aξ∈Vi。
证毕
例子:定理7.12 最小多项式 — 例子
定理7.13 若尔当标准形存在定理
设 A 是复数域上 n 维线性空间 V 的一个线性变换,则 V 中一定存在一组基,A 在这组基下的矩阵是若尔当形矩阵,称为 A 的若尔当标准形。
证
由定理7.12,V=V1⊕⋯⊕Vs,其中 Vi=ker(A−λiE)ri。在每个 Vi 中,A 的限制的特征多项式为 (λ−λi)ri。
只需证:若 A 是 m 维空间 W 上的线性变换,特征多项式为 (λ−λ0)m,则 W 中存在一组基使 A 的矩阵为若尔当形。
令 B=A−λ0E,则 Bm=0(幂零变换)。构造 W 的基如下:
取 Bm−1W 的基,再取 Bm−2W 中补充向量使其与 Bm−1W 的基一起构成 Bm−2W 的基,依此类推。
具体地,设 Bm−1W 的维数为 k1,取基 β1,…,βk1。这些向量在 Bm−2W 中,补充 γ1,…,γk2 使 β1,…,βk1,γ1,…,γk2 构成 Bm−2W 的基。
对每个 γj,Bγj∈Bm−1W,B2γj∈BmW={0}。由此生成若尔当链 γj,Bγj,B2γj,…。
继续此过程,最终得到 W 的一组基,其中每个向量属于某条若尔当链。在每条链 α,Bα,B2α,…,Bt−1α 中,A(Biα)=λ0Biα+Bi+1α,对应若尔当块。
证毕
例子:定理7.13 最小多项式整除特征多项式 — 例子
定理7.14 复矩阵的若尔当标准形
每个 n 阶复矩阵 A 一定与一个若尔当形矩阵相似。这个若尔当形矩阵除去其中若尔当块的排列顺序外由 A 唯一决定,称为 A 的若尔当标准形。
证
存在性:由定理7.13,A 对应的线性变换在某基下的矩阵为若尔当形 J,A 与 J 相似。
唯一性:设 A 相似于两个若尔当形矩阵 J1 和 J2,则 J1 与 J2 相似。相似矩阵有相同的特征多项式,故 J1 和 J2 有相同的特征值及代数重数。
对于特征值 λ,J1 中属于 λ 的若尔当块由 (J1−λE)k 的秩决定(k=1,2,…)。具体地,属于 λ 的阶数 ⩾k 的若尔当块个数为秩(Bk−1)− 秩(Bk),其中 B=A−λE。相似矩阵的各次幂的秩相同,故 J1 和 J2 中各阶若尔当块个数相同,即 J1 和 J2 至多排列顺序不同。
证毕
例子:定理7.14 可对角化的最小多项式条件 — 例子
定理7.15 可对角化与最小多项式
数域 P 上 n 阶矩阵 A 与对角矩阵相似的充分必要条件为 A 的最小多项式是 P 上互素的一次因式的乘积。
推论:复矩阵 A 与对角矩阵相似的充分必要条件是 A 的最小多项式没有重根。
证
必要性:若 A 相似于对角矩阵 diag(λ1,…,λn),设 λ1,…,λs 是互不相同的特征值。令 g(λ)=(λ−λ1)(λ−λ2)…(λ−λs),则 g(A)=0(因为 g(λi)=0,对角矩阵代入后每个对角元为零)。最小多项式 m(λ) 整除 g(λ),而 g(λ) 是互素一次因式的乘积,故 m(λ) 也是互素一次因式的乘积。
充分性:设最小多项式 m(λ)=(λ−λ1)…(λ−λs),其中 λi 互不相同。由定理7.12,V=V1⊕⋯⊕Vs,其中 Vi=ker(A−λiE)(注意这里 ri=1,因为最小多项式中每个一次因子只出现一次)。
Vi 中的向量都是属于 λi 的特征向量。取每个 Vi 的基,合起来是 V 的基,A 在此基下的矩阵是对角矩阵。
推论:在复数域上,一次因式总能分解,故 A 可对角化 ⇔ 最小多项式是互素一次因式之积 ⇔ 最小多项式无重根。
证毕
例子:定理7.15 线性变换的运算 — 例子
相关链接
来源引用