矩阵的特征值刻画矩阵的奇异性、反映矩阵所有对角元素的结构、刻画矩阵的正定性,是矩阵的固有属性。
特征问题与特征方程
矩阵的本质是对变换的描述。矩阵的特征值和特征向量刻画了变换的特性。
线性算子的特征值和特征向量
若非零向量 u u 作为线性算子
L[u]=λu,u≠0 L [ u ] = λ u , u ≠ 0
则称向量 u u 是线性算子
矩阵的特征值和特征向量
线性变换若可以表示为
可知:
线性变换的特征值和特征向量⇔线性变换的标准矩阵的特征值和特征向量 线 性 变 换 的 特 征 值 和 特 征 向 量 ⇔ 线 性 变 换 的 标 准 矩 阵 的 特 征 值 和 特 征 向 量
物理意义
矩阵 A A 对特征向量
Hermitian矩阵(复共轭对称阵)的特征值
Hermitian矩阵的特征值一定是实数,且
A=UΣUH A = U Σ U H
其中, U=[u1,u2,...,un]T U = [ u 1 , u 2 , . . . , u n ] T , Σ=diag(λ1,...,λn) Σ = d i a g ( λ 1 , . . . , λ n )
特征值和特征向量的求解
求出使得矩阵 A−λI A − λ I 奇异(即行列式为0,矩阵不满秩)的 λ λ ,即为特征值。根据 λ λ 的值,求所有满足 (A−λI)=0 ( A − λ I ) = 0 的非零向量 x x ,即为特征向量特征多项式
定义矩阵A的特征多项式为 det(A−λI)=0 d e t ( A − λ I ) = 0 ,特征多项式的根即为矩阵 A A 的特征值。
定理
任何多项式都可以写成
p(λ)=λn+a1λn−1+...+an p ( λ ) = λ n + a 1 λ n − 1 + . . . + a n
可以写成 p(λ)=det(λI−A) p ( λ ) = d e t ( λ I − A ) ,其中,
A=⎡⎣⎢⎢⎢⎢⎢⎢⎢−a1−10⋮0−a20−1⋮0⋯00⋱⋯−an−100⋮−1−an00⋮0⎤⎦⎥⎥⎥⎥⎥⎥⎥(1) (1) A = [ − a 1 − a 2 ⋯ − a n − 1 − a n − 1 0 0 0 0 0 − 1 0 0 0 ⋮ ⋮ ⋱ ⋮ ⋮ 0 0 ⋯ − 1 0 ]
特征值与特征向量
特征值
特征值的一些相关术语:
(1)代数多重度(algebraic multiplicity):是指 λ λ 是特征方程的几重根。
(2)单特征值(simple eigenvalue):是指代数多重度为1.
(3)几何多重度(geometric multiplicity):是指与 λ λ 对应的线性无关的特征向量的个数。也就是特征空间 Null(A−λI) N u l l ( A − λ I ) 的维数。注意,一个特征值可能对应多个线性无关的特征向量。
(4)减次矩阵(derogatory matrix):是指至少有一个特征值的几何多重度大于1.
(5)半单特征值(semi-simple eigenvalue):代数多重度等于几何多重度。
性质
性质1矩阵奇异,等价于至少有一个特征值等于0。
这是因为对奇异矩阵,有 Au=0 A u = 0 存在非零解。
性质2矩阵与其转置矩阵的特征值相同。
易得。
性质3λ λ 是 n×n n × n 矩阵 A A 的特征值。
矩阵的幂的特征值等于特征值的幂,即
A+σ2I A + σ 2 I 的特征值等于 λ+σ2 λ + σ 2 若A非奇异,则 A−1 A − 1 有特征值 1λ 1 λ
特征向量
左特征向量
Av=λv A v = λ v
右特征向量
uHA=λuH u H A = λ u H
Hermitian矩阵左右特征向量相同。
特征值分解只适用于正方阵。
定理
矩阵 A A 的不同特征值对应的特征向量之间是线性无关的。
矩阵的条件数
任何一个矩阵A的单个特征值的条件数是
即左右特征向量的余弦的倒数。
矩阵的行列式、矩阵的迹与特征值的关系
(1)矩阵的迹等于所有特征值之和
tr(A)=∑i=1nλi t r ( A ) = ∑ i = 1 n λ i
(2)矩阵的行列式等于矩阵所有特征值的乘积
det(A)=∏i=1nλi d e t ( A ) = ∏ i = 1 n λ i
矩阵多项式的特征值
A的n次多项式
f(A)=An+c1An−1+...+cn−1A+cnI f ( A ) = A n + c 1 A n − 1 + . . . + c n − 1 A + c n I
的特征值是
f(λ)=λn+c1λn−1+...+cn−1λ+cn f ( λ ) = λ n + c 1 λ n − 1 + . . . + c n − 1 λ + c n
特征值和特征向量的性质总结
n×n n × n 的矩阵一共有 n n 个特征值,多重特征值按照多重度计入。
非对称实矩阵存在复的特征值或者复的特征向量,必定以复共轭对的形式出现
复共轭对称阵(Hermitian matrix)的所有特征值都是实数。
关于对角矩阵和三角矩阵的特征值:
(1)对角阵的特征值为对角元素;
(2)三角阵的对角元素是其所有特征值;
共轭对称
(1)转置:矩阵A的特征值是
(2)共轭:矩阵A的特征值是 λ λ , 则 λ∗ λ ∗ 是其共轭矩阵的特征值
(3) A+σ2I A + σ 2 I 的特征值等于 λ+σ2 λ + σ 2
(4)逆矩阵:若A非奇异,则 A−1 A − 1 有特征值 1λ 1 λ
幂等矩阵
幂等矩阵 A2=A A 2 = A 的所有特征值取值为0或者1
实正交矩阵
所有特征值位于单位圆上
特征值与奇异性
奇异矩阵⇔至少有一个特征值为0 奇 异 矩 阵 ⇔ 至 少 有 一 个 特 征 值 为 0
特征值与矩阵的迹
特征值求和等于矩阵的迹
特征值与行列式
特征值乘积等于行列式
矩阵 A A 的不同特征值对应的特征向量之间是线性无关的。
Hermitian矩阵的正定性
特征值与矩阵的秩
(1) n×n n × n 的矩阵有 r r 个非零特征值,则其秩至少为
(2)若0是 n×n n × n 矩阵A的无多重特征值,则 rank(A)=n−1 r a n k ( A ) = n − 1
(3)若
rank(A−λI)≤n−1 r a n k ( A − λ I ) ≤ n − 1
则 λ λ 是矩阵 A A 的特征值。
这是因为
多重度
n×n n × n 的矩阵的任意特征值的几何多重度不可能大于代数多重度。
乘积的特征值
关于m×n(n≥m) m × n ( n ≥ m )矩阵 A A 与
(1)若
(2)若 λ≠0 λ ≠ 0 是矩阵乘积 BA B A 的特征值,则其也是 AB A B 的特征值
(3)若 λ1,λ2,...,λm λ 1 , λ 2 , . . . , λ m 是矩阵乘积 AB A B 的特征值,则 BA B A 的n个特征值为
λ1,λ2,...,λm,0,...,0 λ 1 , λ 2 , . . . , λ m , 0 , . . . , 0
多项式的特征值
如前述
矩阵的指数函数的特征值
矩阵特征值与特征向量对的性质
若 n×n n × n 矩阵 A A 有
矩阵奇异值与特征值的关系
矩阵 Am×n A m × n 的非零奇异值等于 AAT A A T 或者 ATA A T A 的非零特征值的正平方根,且对应的左奇异向量与右奇异向量分别是矩阵 AAT A A T 与 ATA A T A 对应的特征向量。
矩阵的可对角化定理
一个n×n的实矩阵A可对角化⇔A具有n个线性无关的特征向量 一 个 n × n 的 实 矩 阵 A 可 对 角 化 ⇔ A 具 有 n 个 线 性 无 关 的 特 征 向 量A具有n个不同的特征值⇒A可以对角化 A 具 有 n 个 不 同 的 特 征 值 ⇒ A 可 以 对 角 化注意,即使 A A 有多重根,它仍然可能是可以对角化的。因为它的n个特征向量可能是线性无关的。
广义特征值分解
对于非正方阵,仍然可以求特征值。考虑两个矩阵组成的矩阵对的特征值分解。
广义特征值分解
参考文献
《矩阵分析与应用》,张贤达