内容概述
本章首先由倒数的概念,引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来,讲解了可逆矩阵对应线性方程解的唯一性,以及可逆矩阵的几个有用的性质。本章的最后,讲解了计算逆矩阵的一种通用方法,即利用初等矩阵来计算逆矩阵。
由倒数引申出矩阵的逆
假设有一个实数
5
5
5,
5
5
5的乘法逆是
1
/
5
1/5
1/5或
5
−
1
5^{-1}
5−1,它满足方程:
5
−
1
⋅
5
=
1
5^{-1} \cdot 5 = 1
5−1⋅5=1和
5
⋅
5
−
1
=
1
5 \cdot 5^{-1} = 1
5⋅5−1=1,矩阵对逆的一般化也要求两个方程同时成立,所以当且仅当矩阵是方阵时,矩阵才有可能可逆(因为矩阵乘法要求左边矩阵的列等于右边矩阵的行,如果某个矩阵能同时满足左乘和右乘,那么只能是
n
×
n
n \times n
n×n方阵) 定义:
一个
n
×
n
n \times n
n×n矩阵
A
A
A是可逆的,若存在一个
n
×
n
n \times n
n×n矩阵
C
C
C,使得:
C
A
=
I
CA = \boldsymbol I
CA=I 且
A
C
=
I
AC = \boldsymbol I
AC=I 其中
I
=
I
n
\boldsymbol I = \boldsymbol I_n
I=In是
n
×
n
n \times n
n×n单位矩阵。这时称
C
C
C是
A
A
A的逆。
实际上,
C
C
C由
A
A
A唯一确定,因为若
B
B
B是另一个
A
A
A的逆,那么将有
B
=
B
I
=
B
(
A
C
)
=
(
B
A
)
C
=
I
C
=
C
B=B \boldsymbol I = B(AC)=(BA)C=\boldsymbol I C = C
B=BI=B(AC)=(BA)C=IC=C。于是,若
A
A
A可逆,它的逆是唯一的,我们将它记为
A
−
1
A^{-1}
A−1,于是:
A
−
1
A
=
I
A^{-1}A = \boldsymbol I
A−1A=I 且
A
A
−
1
=
I
AA^{-1} = \boldsymbol I
AA−1=I 不可逆矩阵被称为奇异矩阵,而可逆矩阵也可称作非奇异矩阵。 例:
若
A
=
[
2
5
−
3
−
7
]
A=\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}
A=[2−35−7],
C
=
[
−
7
−
5
3
2
]
C=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}
C=[−73−52],则:
A
C
=
[
2
5
−
3
−
7
]
[
−
7
−
5
3
2
]
=
[
1
0
0
1
]
AC = \begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}
AC=[2−35−7][−73−52]=[1001]
C
A
=
[
−
7
−
5
3
2
]
[
2
5
−
3
−
7
]
=
[
1
0
0
1
]
CA=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}
CA=[−73−52][2−35−7]=[1001] 所以,
C
=
A
−
1
C=A^{-1}
C=A−1
行列式
定理:
设
A
=
[
a
b
c
d
]
A = \begin{bmatrix}a & b \\ c & d\end{bmatrix}
A=[acbd],若
a
d
−
b
c
≠
0
ad - bc \neq 0
ad−bc=0,则
A
A
A可逆且
A
−
1
=
1
a
d
−
b
c
[
d
−
b
−
c
a
]
A^{-1} = \frac{1}{ad-bc}\begin{bmatrix}d & -b \\ -c & a\end{bmatrix}
A−1=ad−bc1[d−c−ba] 若
a
d
−
b
c
=
0
ad - bc = 0
ad−bc=0,则
A
A
A不可逆
定理的证明可以通过上述逆矩阵的定义公式来进行。数
a
d
−
b
c
ad-bc
ad−bc称为
A
A
A的行列式,记为:
d
e
t
A
=
a
d
−
b
c
det\,A = ad -bc
detA=ad−bc 当且仅当
d
e
t
A
≠
0
det\,A \neq 0
detA=0时,上述
2
×
2
2 \times 2
2×2矩阵
A
A
A可逆。 例:
求
A
=
[
3
4
5
6
]
A=\begin{bmatrix}3 & 4 \\ 5 & 6\end{bmatrix}
A=[3546]的逆
解:
因为
d
e
t
A
=
3
(
6
)
−
4
(
5
)
=
−
2
≠
0
det\,A = 3(6)-4(5)=-2 \neq 0
detA=3(6)−4(5)=−2=0,所以
A
A
A可逆,且:
A
−
1
=
1
−
2
[
6
−
4
−
5
3
]
=
[
−
3
2
5
/
2
−
3
/
2
]
A^{-1} = \frac{1}{-2}\begin{bmatrix}6 & -4 \\ -5 & 3\end{bmatrix} = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}
A−1=−21[6−5−43]=[−35/22−3/2]
可逆矩阵对应线性方程解的唯一性
定理:
若
A
A
A是可逆
n
×
n
n \times n
n×n矩阵,则对每一
R
n
\mathbb R^n
Rn中的
b
\boldsymbol b
b,方程
A
x
=
b
A\boldsymbol x = \boldsymbol b
Ax=b有唯一解
x
=
A
−
1
b
\boldsymbol x = A^{-1}\boldsymbol b
x=A−1b
证明:
先证明
A
−
1
b
A^{-1}\boldsymbol b
A−1b是方程的一个解: 因为
A
A
A可逆,那么若以
A
−
1
b
A^{-1} \boldsymbol b
A−1b代替
x
\boldsymbol x
x,有:
A
x
=
A
(
A
−
1
b
)
=
(
A
A
−
1
)
b
=
I
b
=
b
A\boldsymbol x = A(A^{-1}\boldsymbol b) = (AA^{-1})\boldsymbol b = \boldsymbol I \boldsymbol b = \boldsymbol b
Ax=A(A−1b)=(AA−1)b=Ib=b,所以
A
−
1
b
A^{-1}\boldsymbol b
A−1b是方程的一个解。 再证明解的唯一性: 假设
u
\boldsymbol u
u是方程的任意一个解,那么有:
A
u
=
b
A\boldsymbol u = \boldsymbol b
Au=b,由于
A
A
A可逆,那么方程两边同时乘以
A
−
1
A^{-1}
A−1得:
A
−
1
A
u
=
A
−
1
b
A^{-1}A\boldsymbol u = A^{-1}\boldsymbol b
A−1Au=A−1b,进一步推导有:
I
u
=
A
−
1
b
\boldsymbol I \boldsymbol u = A^{-1}\boldsymbol b
Iu=A−1b,也就是:
u
=
A
−
1
b
\boldsymbol u = A^{-1}\boldsymbol b
u=A−1b 得证
上述定理很少用来解方程
A
x
=
b
A\boldsymbol x = \boldsymbol b
Ax=b,因为
[
A
b
]
\begin{bmatrix}A & \boldsymbol b\end{bmatrix}
[Ab]的行化简通常更快。一个可能的例外是
2
×
2
2 \times 2
2×2矩阵,因为这时利用行列式计算
A
−
1
A^{-1}
A−1相对比较容易。 例:
求解方程组:
3
x
1
+
4
x
2
=
3
5
x
1
+
6
x
2
=
7
\begin{aligned} 3x_1 + 4x_2 = 3 \\ 5x_1 + 6x_2 = 7 \end{aligned}
3x1+4x2=35x1+6x2=7
解:
x
=
A
−
1
b
=
[
−
3
2
5
/
2
−
3
/
2
]
[
3
7
]
=
[
5
−
3
]
\boldsymbol x = A^{-1}\boldsymbol b = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}\begin{bmatrix}3 \\ 7\end{bmatrix} = \begin{bmatrix}5 \\ -3\end{bmatrix}
x=A−1b=[−35/22−3/2][37]=[5−3]
可逆矩阵的几个性质
若
A
A
A是可逆矩阵,则
A
−
1
A^{-1}
A−1也可逆而且
(
A
−
1
)
−
1
=
A
(A^{-1})^{-1} = A
(A−1)−1=A若
A
A
A和
B
B
B都是可逆矩阵,则
A
B
AB
AB也可逆,且其逆是
A
A
A和
B
B
B的逆矩阵按相反顺序的乘积,即:
(
A
B
)
−
1
=
B
−
1
A
−
1
(AB)^{-1} = B^{-1}A^{-1}
(AB)−1=B−1A−1若
A
A
A可逆,则
A
T
A^{T}
AT也可逆,且其逆是
A
−
1
A^{-1}
A−1的转置,即
(
A
T
)
−
1
=
(
A
−
1
)
T
(A^{T})^{-1}=(A^{-1})^{T}
(AT)−1=(A−1)T
简单证明上述第2个性质:
从逆矩阵定义出发,要证明
B
−
1
A
−
1
B^{-1}A^{-1}
B−1A−1是
A
B
AB
AB的逆矩阵,则要证明
A
B
AB
AB左乘和右乘
B
−
1
A
−
1
B^{-1}A^{-1}
B−1A−1的积都是
I
\boldsymbol I
I。以右乘为例:
(
A
B
)
(
B
−
1
A
−
1
)
=
A
(
B
B
−
1
)
A
−
1
=
A
I
A
−
1
=
A
A
−
1
=
I
(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\boldsymbol IA^{-1} = AA^{-1} = \boldsymbol I
(AB)(B−1A−1)=A(BB−1)A−1=AIA−1=AA−1=I。同理可以证明左乘的情况一样成立。
初等矩阵
定义:
把单位矩阵进行一次初等行变换,就得到初等矩阵。
例:
下面
E
1
E_1
E1是一个对应倍加变换的初等矩阵:
E
1
=
[
1
0
0
0
1
0
−
4
0
1
]
E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}
E1=⎣⎡10−4010001⎦⎤ 下面
E
2
E_2
E2是一个对应对换变换的初等矩阵:
E
2
=
[
0
1
0
1
0
0
0
0
1
]
E_2 = \begin{bmatrix}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix}
E2=⎣⎡010100001⎦⎤ 下面
E
3
E_3
E3是一个对应倍乘变换的初等矩阵:
E
3
=
[
1
0
0
0
1
0
0
0
5
]
E_3=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 5\end{bmatrix}
E3=⎣⎡100010005⎦⎤ 假设有一个矩阵
A
=
[
a
b
c
d
e
f
g
h
i
]
A=\begin{bmatrix}a & b & c \\ d & e & f \\ g & h & i\end{bmatrix}
A=⎣⎡adgbehcfi⎦⎤,观察
E
1
A
E_1A
E1A,
E
2
A
E_2A
E2A,
E
3
A
E_3A
E3A所起的作用。
解:
经过计算可知:
E
1
A
=
[
a
b
c
d
e
f
g
−
4
a
h
−
4
a
i
−
4
c
]
E_1A = \begin{bmatrix}a & b & c \\ d & e & f \\g-4a & h-4a & i-4c \end{bmatrix}
E1A=⎣⎡adg−4abeh−4acfi−4c⎦⎤
E
2
A
=
[
d
e
f
a
b
c
g
h
i
]
E_2A=\begin{bmatrix}d & e & f \\ a & b & c \\ g & h & i \end{bmatrix}
E2A=⎣⎡dagebhfci⎦⎤
E
3
A
=
[
a
b
c
d
e
f
5
g
5
h
5
i
]
E_3A=\begin{bmatrix}a & b & c \\ d & e & f \\5g & 5h & 5i \end{bmatrix}
E3A=⎣⎡ad5gbe5hcf5i⎦⎤ 从上述可知,这些乘积可由
A
A
A进行
E
i
E_i
Ei暗含的初等行变换得到。
还需注意:
把
3
×
n
3 \times n
3×n矩阵左乘以(即在左边相乘)上述
E
i
E_i
Ei,均会产生相应的效果。特别地,
E
i
I
=
E
i
E_i \boldsymbol I = E_i
EiI=Ei,也就是说,
E
i
E_i
Ei本身是把单位矩阵以同一行变换作用所得。 因此可以得到如下的一般结论:
若对
m
×
n
m \times n
m×n矩阵
A
A
A进行某种初等行变换,所得矩阵可写成
E
A
EA
EA,其中
E
E
E是
m
×
m
m \times m
m×m矩阵,是由
I
m
\boldsymbol I_m
Im进行统一行变换所得。
因为行变换是可逆的,故初等矩阵也是可逆的。若
E
E
E是由
I
\boldsymbol I
I进行行变换所得,则有同一类型的另一行变换把
E
E
E变回
I
\boldsymbol I
I。因此,由初等矩阵
F
F
F,使得
F
E
=
I
FE = \boldsymbol I
FE=I。因为
E
E
E和
F
F
F对应于互逆的变换,所以也有
E
F
=
I
EF=\boldsymbol I
EF=I。
每个初等矩阵
E
E
E是可逆的,
E
E
E的逆是一个同类型的初等矩阵,它把
E
E
E变回
I
\boldsymbol I
I。
例:
求
E
1
=
[
1
0
0
0
1
0
−
4
0
1
]
E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}
E1=⎣⎡10−4010001⎦⎤的逆。
解:
为把
E
1
E_1
E1变成
I
\boldsymbol I
I,需要把第1行的4倍加到第3行,这相应于初等矩阵:
F
=
E
1
−
1
=
[
1
0
0
0
1
0
4
0
1
]
F = E_1^{-1}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 4 & 0 & 1\end{bmatrix}
F=E1−1=⎣⎡104010001⎦⎤
矩阵可逆的判定以及逆矩阵的计算方法
定理:
n
×
n
n \times n
n×n矩阵
A
A
A是可逆的,当且仅当
A
A
A行等价于
I
n
\boldsymbol I_n
In,这时,把
A
A
A化简为
I
n
\boldsymbol I_n
In的一系列初等行比那换同时把
I
n
\boldsymbol I_n
In变成
A
−
1
A^{-1}
A−1
证明:
设
A
A
A是可逆矩阵,则对任意
b
\boldsymbol b
b,方程
A
x
=
b
A\boldsymbol x = \boldsymbol b
Ax=b有解(参照本文前半段的定理),这就说明,
A
A
A在每一行有一个主元位置。又因为
A
A
A是方阵,所以这
n
n
n个主元位置必在对角线上,相应的,
A
A
A的简化阶梯形是
I
n
\boldsymbol I_n
In,即
A
∼
I
n
A \sim \boldsymbol I_n
A∼In。 反之,若
A
∼
I
n
A \sim \boldsymbol I_n
A∼In,则因为每一步行化简对应于左乘一个初等矩阵,所以存在初等矩阵
E
1
,
⋯
,
E
p
E_1, \cdots, E_p
E1,⋯,Ep,使得:
A
∼
E
1
A
∼
E
2
(
E
1
A
)
∼
⋯
∼
E
p
(
E
p
−
1
⋯
E
1
A
)
=
I
n
A \sim E_1A \sim E_2(E_1A) \sim \cdots \sim E_p(E_{p-1} \cdots E_1A)=\boldsymbol I_n
A∼E1A∼E2(E1A)∼⋯∼Ep(Ep−1⋯E1A)=In 即:
E
p
E
p
−
1
⋯
E
1
A
=
I
n
E_pE_{p-1} \cdots E_1A=\boldsymbol I_n
EpEp−1⋯E1A=In 因为
E
p
⋯
E
1
E_p \cdots E_1
Ep⋯E1是可逆矩阵的乘积,因此其也是可逆矩阵(这点可以参考上述的两点知识:1. 初等矩阵是可逆的;2. 如果两个矩阵是可逆的,那么两个矩阵的乘积也是可逆的),那么可以根据上式推出:
(
E
p
⋯
E
1
)
−
1
(
E
p
⋯
E
1
)
A
=
(
E
p
⋯
E
1
)
−
1
I
n
A
=
(
E
p
⋯
E
1
)
−
1
\begin{aligned} (E_p \cdots E_1)^{-1}(E_p \cdots E_1)A &= (E_p \cdots E_1)^{-1}\boldsymbol I_n \\ A &= (E_p \cdots E_1)^{-1} \end{aligned}
(Ep⋯E1)−1(Ep⋯E1)AA=(Ep⋯E1)−1In=(Ep⋯E1)−1 这说明了
A
A
A是可逆矩阵
E
p
⋯
E
1
E_p \cdots E_1
Ep⋯E1的逆,又由于上述定理所述(可逆矩阵的逆矩阵也可逆),有:
A
−
1
=
[
(
E
p
⋯
E
1
)
−
1
]
−
1
=
E
p
⋯
E
1
A^{-1} = [(E_p \cdots E_1)^{-1}]^{-1} = E_p \cdots E_1
A−1=[(Ep⋯E1)−1]−1=Ep⋯E1
由上述定理的证明过程,自然而然可以引出计算矩阵逆矩阵的一种方法:
把
A
A
A和
I
\boldsymbol I
I排在一起构成增广矩阵
[
A
I
]
\begin{bmatrix}A & \boldsymbol I\end{bmatrix}
[AI],则对此矩阵进行行变换时,
A
A
A和
I
\boldsymbol I
I收到同一变换。要么有一系列的行变换把
A
A
A变成
I
\boldsymbol I
I,同时把
I
\boldsymbol I
I变成
A
−
1
A^{-1}
A−1,要么
A
A
A是不可逆的。
精确描述如下:
把增广矩阵
[
A
I
]
\begin{bmatrix}A & \boldsymbol I\end{bmatrix}
[AI]进行行化简。若
A
A
A行等价于
I
\boldsymbol I
I,则
[
A
I
]
\begin{bmatrix}A & \boldsymbol I\end{bmatrix}
[AI]行等价于
[
I
A
−
1
]
\begin{bmatrix}\boldsymbol I & A^{-1}\end{bmatrix}
[IA−1],否则
A
A
A没有逆。
例:
求矩阵
A
=
[
0
1
2
1
0
3
4
−
3
8
]
A = \begin{bmatrix}0 & 1 & 2 \\ 1 & 0 & 3 \\ 4 & -3 & 8\end{bmatrix}
A=⎣⎡01410−3238⎦⎤的逆,假如它存在。
解:
[
A
I
]
=
[
0
1
2
1
0
0
1
0
3
0
1
0
4
−
3
8
0
0
1
]
∼
[
1
0
0
−
9
/
2
7
−
3
/
2
0
1
0
−
2
4
−
1
0
0
1
3
/
2
−
2
1
/
2
]
\begin{aligned} \begin{bmatrix}A & \boldsymbol I\end{bmatrix} &=\begin{bmatrix}0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & 3 & 0 & 1 & 0 \\4 & -3 & 8 & 0 & 0 & 1\end{bmatrix} \\ &\sim \begin{bmatrix}1 & 0 & 0 & -9/2 & 7 & -3/2 \\ 0 & 1 & 0 & -2 & 4 & -1\\ 0 & 0 & 1 & 3/2 & -2 & 1/2\end{bmatrix} \end{aligned}
[AI]=⎣⎡01410−3238100010001⎦⎤∼⎣⎡100010001−9/2−23/274−2−3/2−11/2⎦⎤ 由上述定理,可知
A
A
A可逆,且:
A
−
1
=
[
−
9
/
2
7
−
3
/
2
−
2
4
−
1
3
/
2
−
2
1
/
2
]
A^{-1} = \begin{bmatrix}-9/2 & 7 & -3/2 \\ -2 & 4 & -1 \\3/2 & -2 & 1/2\end{bmatrix}
A−1=⎣⎡−9/2−23/274−2−3/2−11/2⎦⎤
可逆矩阵的另一个观点
假设
A
A
A可逆,那么有:
A
A
−
1
=
I
AA^{-1} = \boldsymbol I
AA−1=I。由矩阵乘法的定义,
A
A
A乘以
A
−
1
A^{-1}
A−1,就是用
A
A
A去乘以
A
−
1
A^{-1}
A−1的每一列。假设
A
−
1
A^{-1}
A−1的每一行按序号为
x
i
\boldsymbol x_i
xi,那么有:
[
A
x
1
A
x
2
⋯
A
x
n
]
=
[
e
1
e
2
⋯
e
n
]
\begin{bmatrix}A\boldsymbol x_1 & A\boldsymbol x_2 & \cdots & A\boldsymbol x_n\end{bmatrix} = \begin{bmatrix}\boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end{bmatrix}
[Ax1Ax2⋯Axn]=[e1e2⋯en]。要求解逆矩阵
A
−
1
A^{-1}
A−1的某一列
x
i
\boldsymbol x_i
xi,只需要求解方程
A
x
i
=
e
i
A\boldsymbol x_i = \boldsymbol e_i
Axi=ei 即可。这一点是很有用的,因为在某些问题中,只需要
A
−
1
A^{-1}
A−1的一列或两列。