内容概述

本章首先由倒数的概念,引申出逆矩阵的概念。接着讲解了利用行列式来计算二阶方阵逆矩阵的方法。接下来,讲解了可逆矩阵对应线性方程解的唯一性,以及可逆矩阵的几个有用的性质。本章的最后,讲解了计算逆矩阵的一种通用方法,即利用初等矩阵来计算逆矩阵。

由倒数引申出矩阵的逆

假设有一个实数

5

5

5,

5

5

5的乘法逆是

1

/

5

1/5

1/5或

5

1

5^{-1}

5−1,它满足方程:

5

1

5

=

1

5^{-1} \cdot 5 = 1

5−1⋅5=1和

5

5

1

=

1

5 \cdot 5^{-1} = 1

5⋅5−1=1,矩阵对逆的一般化也要求两个方程同时成立,所以当且仅当矩阵是方阵时,矩阵才有可能可逆(因为矩阵乘法要求左边矩阵的列等于右边矩阵的行,如果某个矩阵能同时满足左乘和右乘,那么只能是

n

×

n

n \times n

n×n方阵) 定义:

一个

n

×

n

n \times n

n×n矩阵

A

A

A是可逆的,若存在一个

n

×

n

n \times n

n×n矩阵

C

C

C,使得:

C

A

=

I

CA = \boldsymbol I

CA=I 且

A

C

=

I

AC = \boldsymbol I

AC=I 其中

I

=

I

n

\boldsymbol I = \boldsymbol I_n

I=In​是

n

×

n

n \times n

n×n单位矩阵。这时称

C

C

C是

A

A

A的逆。

实际上,

C

C

C由

A

A

A唯一确定,因为若

B

B

B是另一个

A

A

A的逆,那么将有

B

=

B

I

=

B

(

A

C

)

=

(

B

A

)

C

=

I

C

=

C

B=B \boldsymbol I = B(AC)=(BA)C=\boldsymbol I C = C

B=BI=B(AC)=(BA)C=IC=C。于是,若

A

A

A可逆,它的逆是唯一的,我们将它记为

A

1

A^{-1}

A−1,于是:

A

1

A

=

I

A^{-1}A = \boldsymbol I

A−1A=I 且

A

A

1

=

I

AA^{-1} = \boldsymbol I

AA−1=I 不可逆矩阵被称为奇异矩阵,而可逆矩阵也可称作非奇异矩阵。 例:

A

=

[

2

5

3

7

]

A=\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}

A=[2−3​5−7​],

C

=

[

7

5

3

2

]

C=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}

C=[−73​−52​],则:

A

C

=

[

2

5

3

7

]

[

7

5

3

2

]

=

[

1

0

0

1

]

AC = \begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix}\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}

AC=[2−3​5−7​][−73​−52​]=[10​01​]

C

A

=

[

7

5

3

2

]

[

2

5

3

7

]

=

[

1

0

0

1

]

CA=\begin{bmatrix}-7 & -5 \\ 3 & 2\end{bmatrix}\begin{bmatrix}2 & 5 \\ -3 & -7\end{bmatrix} = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}

CA=[−73​−52​][2−3​5−7​]=[10​01​] 所以,

C

=

A

1

C=A^{-1}

C=A−1

行列式

定理:

A

=

[

a

b

c

d

]

A = \begin{bmatrix}a & b \\ c & d\end{bmatrix}

A=[ac​bd​],若

a

d

b

c

0

ad - bc \neq 0

ad−bc​=0,则

A

A

A可逆且

A

1

=

1

a

d

b

c

[

d

b

c

a

]

A^{-1} = \frac{1}{ad-bc}\begin{bmatrix}d & -b \\ -c & a\end{bmatrix}

A−1=ad−bc1​[d−c​−ba​] 若

a

d

b

c

=

0

ad - bc = 0

ad−bc=0,则

A

A

A不可逆

定理的证明可以通过上述逆矩阵的定义公式来进行。数

a

d

b

c

ad-bc

ad−bc称为

A

A

A的行列式,记为:

d

e

t

A

=

a

d

b

c

det\,A = ad -bc

detA=ad−bc 当且仅当

d

e

t

A

0

det\,A \neq 0

detA​=0时,上述

2

×

2

2 \times 2

2×2矩阵

A

A

A可逆。 例:

A

=

[

3

4

5

6

]

A=\begin{bmatrix}3 & 4 \\ 5 & 6\end{bmatrix}

A=[35​46​]的逆

解:

因为

d

e

t

A

=

3

(

6

)

4

(

5

)

=

2

0

det\,A = 3(6)-4(5)=-2 \neq 0

detA=3(6)−4(5)=−2​=0,所以

A

A

A可逆,且:

A

1

=

1

2

[

6

4

5

3

]

=

[

3

2

5

/

2

3

/

2

]

A^{-1} = \frac{1}{-2}\begin{bmatrix}6 & -4 \\ -5 & 3\end{bmatrix} = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}

A−1=−21​[6−5​−43​]=[−35/2​2−3/2​]

可逆矩阵对应线性方程解的唯一性

定理:

A

A

A是可逆

n

×

n

n \times n

n×n矩阵,则对每一

R

n

\mathbb R^n

Rn中的

b

\boldsymbol b

b,方程

A

x

=

b

A\boldsymbol x = \boldsymbol b

Ax=b有唯一解

x

=

A

1

b

\boldsymbol x = A^{-1}\boldsymbol b

x=A−1b

证明:

先证明

A

1

b

A^{-1}\boldsymbol b

A−1b是方程的一个解: 因为

A

A

A可逆,那么若以

A

1

b

A^{-1} \boldsymbol b

A−1b代替

x

\boldsymbol x

x,有:

A

x

=

A

(

A

1

b

)

=

(

A

A

1

)

b

=

I

b

=

b

A\boldsymbol x = A(A^{-1}\boldsymbol b) = (AA^{-1})\boldsymbol b = \boldsymbol I \boldsymbol b = \boldsymbol b

Ax=A(A−1b)=(AA−1)b=Ib=b,所以

A

1

b

A^{-1}\boldsymbol b

A−1b是方程的一个解。 再证明解的唯一性: 假设

u

\boldsymbol u

u是方程的任意一个解,那么有:

A

u

=

b

A\boldsymbol u = \boldsymbol b

Au=b,由于

A

A

A可逆,那么方程两边同时乘以

A

1

A^{-1}

A−1得:

A

1

A

u

=

A

1

b

A^{-1}A\boldsymbol u = A^{-1}\boldsymbol b

A−1Au=A−1b,进一步推导有:

I

u

=

A

1

b

\boldsymbol I \boldsymbol u = A^{-1}\boldsymbol b

Iu=A−1b,也就是:

u

=

A

1

b

\boldsymbol u = A^{-1}\boldsymbol b

u=A−1b 得证

上述定理很少用来解方程

A

x

=

b

A\boldsymbol x = \boldsymbol b

Ax=b,因为

[

A

b

]

\begin{bmatrix}A & \boldsymbol b\end{bmatrix}

[A​b​]的行化简通常更快。一个可能的例外是

2

×

2

2 \times 2

2×2矩阵,因为这时利用行列式计算

A

1

A^{-1}

A−1相对比较容易。 例:

求解方程组:

3

x

1

+

4

x

2

=

3

5

x

1

+

6

x

2

=

7

\begin{aligned} 3x_1 + 4x_2 = 3 \\ 5x_1 + 6x_2 = 7 \end{aligned}

3x1​+4x2​=35x1​+6x2​=7​

解:

x

=

A

1

b

=

[

3

2

5

/

2

3

/

2

]

[

3

7

]

=

[

5

3

]

\boldsymbol x = A^{-1}\boldsymbol b = \begin{bmatrix}-3 & 2 \\ 5/2 & -3/2\end{bmatrix}\begin{bmatrix}3 \\ 7\end{bmatrix} = \begin{bmatrix}5 \\ -3\end{bmatrix}

x=A−1b=[−35/2​2−3/2​][37​]=[5−3​]

可逆矩阵的几个性质

A

A

A是可逆矩阵,则

A

1

A^{-1}

A−1也可逆而且

(

A

1

)

1

=

A

(A^{-1})^{-1} = A

(A−1)−1=A若

A

A

A和

B

B

B都是可逆矩阵,则

A

B

AB

AB也可逆,且其逆是

A

A

A和

B

B

B的逆矩阵按相反顺序的乘积,即:

(

A

B

)

1

=

B

1

A

1

(AB)^{-1} = B^{-1}A^{-1}

(AB)−1=B−1A−1若

A

A

A可逆,则

A

T

A^{T}

AT也可逆,且其逆是

A

1

A^{-1}

A−1的转置,即

(

A

T

)

1

=

(

A

1

)

T

(A^{T})^{-1}=(A^{-1})^{T}

(AT)−1=(A−1)T

简单证明上述第2个性质:

从逆矩阵定义出发,要证明

B

1

A

1

B^{-1}A^{-1}

B−1A−1是

A

B

AB

AB的逆矩阵,则要证明

A

B

AB

AB左乘和右乘

B

1

A

1

B^{-1}A^{-1}

B−1A−1的积都是

I

\boldsymbol I

I。以右乘为例:

(

A

B

)

(

B

1

A

1

)

=

A

(

B

B

1

)

A

1

=

A

I

A

1

=

A

A

1

=

I

(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = A\boldsymbol IA^{-1} = AA^{-1} = \boldsymbol I

(AB)(B−1A−1)=A(BB−1)A−1=AIA−1=AA−1=I。同理可以证明左乘的情况一样成立。

初等矩阵

定义:

把单位矩阵进行一次初等行变换,就得到初等矩阵。

例:

下面

E

1

E_1

E1​是一个对应倍加变换的初等矩阵:

E

1

=

[

1

0

0

0

1

0

4

0

1

]

E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}

E1​=⎣⎡​10−4​010​001​⎦⎤​ 下面

E

2

E_2

E2​是一个对应对换变换的初等矩阵:

E

2

=

[

0

1

0

1

0

0

0

0

1

]

E_2 = \begin{bmatrix}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix}

E2​=⎣⎡​010​100​001​⎦⎤​ 下面

E

3

E_3

E3​是一个对应倍乘变换的初等矩阵:

E

3

=

[

1

0

0

0

1

0

0

0

5

]

E_3=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 5\end{bmatrix}

E3​=⎣⎡​100​010​005​⎦⎤​ 假设有一个矩阵

A

=

[

a

b

c

d

e

f

g

h

i

]

A=\begin{bmatrix}a & b & c \\ d & e & f \\ g & h & i\end{bmatrix}

A=⎣⎡​adg​beh​cfi​⎦⎤​,观察

E

1

A

E_1A

E1​A,

E

2

A

E_2A

E2​A,

E

3

A

E_3A

E3​A所起的作用。

解:

经过计算可知:

E

1

A

=

[

a

b

c

d

e

f

g

4

a

h

4

a

i

4

c

]

E_1A = \begin{bmatrix}a & b & c \\ d & e & f \\g-4a & h-4a & i-4c \end{bmatrix}

E1​A=⎣⎡​adg−4a​beh−4a​cfi−4c​⎦⎤​

E

2

A

=

[

d

e

f

a

b

c

g

h

i

]

E_2A=\begin{bmatrix}d & e & f \\ a & b & c \\ g & h & i \end{bmatrix}

E2​A=⎣⎡​dag​ebh​fci​⎦⎤​

E

3

A

=

[

a

b

c

d

e

f

5

g

5

h

5

i

]

E_3A=\begin{bmatrix}a & b & c \\ d & e & f \\5g & 5h & 5i \end{bmatrix}

E3​A=⎣⎡​ad5g​be5h​cf5i​⎦⎤​ 从上述可知,这些乘积可由

A

A

A进行

E

i

E_i

Ei​暗含的初等行变换得到。

还需注意:

3

×

n

3 \times n

3×n矩阵左乘以(即在左边相乘)上述

E

i

E_i

Ei​,均会产生相应的效果。特别地,

E

i

I

=

E

i

E_i \boldsymbol I = E_i

Ei​I=Ei​,也就是说,

E

i

E_i

Ei​本身是把单位矩阵以同一行变换作用所得。 因此可以得到如下的一般结论:

若对

m

×

n

m \times n

m×n矩阵

A

A

A进行某种初等行变换,所得矩阵可写成

E

A

EA

EA,其中

E

E

E是

m

×

m

m \times m

m×m矩阵,是由

I

m

\boldsymbol I_m

Im​进行统一行变换所得。

因为行变换是可逆的,故初等矩阵也是可逆的。若

E

E

E是由

I

\boldsymbol I

I进行行变换所得,则有同一类型的另一行变换把

E

E

E变回

I

\boldsymbol I

I。因此,由初等矩阵

F

F

F,使得

F

E

=

I

FE = \boldsymbol I

FE=I。因为

E

E

E和

F

F

F对应于互逆的变换,所以也有

E

F

=

I

EF=\boldsymbol I

EF=I。

每个初等矩阵

E

E

E是可逆的,

E

E

E的逆是一个同类型的初等矩阵,它把

E

E

E变回

I

\boldsymbol I

I。

例:

E

1

=

[

1

0

0

0

1

0

4

0

1

]

E_1 = \begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ -4 & 0 & 1\end{bmatrix}

E1​=⎣⎡​10−4​010​001​⎦⎤​的逆。

解:

为把

E

1

E_1

E1​变成

I

\boldsymbol I

I,需要把第1行的4倍加到第3行,这相应于初等矩阵:

F

=

E

1

1

=

[

1

0

0

0

1

0

4

0

1

]

F = E_1^{-1}=\begin{bmatrix}1 & 0 & 0 \\ 0 & 1 & 0 \\ 4 & 0 & 1\end{bmatrix}

F=E1−1​=⎣⎡​104​010​001​⎦⎤​

矩阵可逆的判定以及逆矩阵的计算方法

定理:

n

×

n

n \times n

n×n矩阵

A

A

A是可逆的,当且仅当

A

A

A行等价于

I

n

\boldsymbol I_n

In​,这时,把

A

A

A化简为

I

n

\boldsymbol I_n

In​的一系列初等行比那换同时把

I

n

\boldsymbol I_n

In​变成

A

1

A^{-1}

A−1

证明:

A

A

A是可逆矩阵,则对任意

b

\boldsymbol b

b,方程

A

x

=

b

A\boldsymbol x = \boldsymbol b

Ax=b有解(参照本文前半段的定理),这就说明,

A

A

A在每一行有一个主元位置。又因为

A

A

A是方阵,所以这

n

n

n个主元位置必在对角线上,相应的,

A

A

A的简化阶梯形是

I

n

\boldsymbol I_n

In​,即

A

I

n

A \sim \boldsymbol I_n

A∼In​。 反之,若

A

I

n

A \sim \boldsymbol I_n

A∼In​,则因为每一步行化简对应于左乘一个初等矩阵,所以存在初等矩阵

E

1

,

,

E

p

E_1, \cdots, E_p

E1​,⋯,Ep​,使得:

A

E

1

A

E

2

(

E

1

A

)

E

p

(

E

p

1

E

1

A

)

=

I

n

A \sim E_1A \sim E_2(E_1A) \sim \cdots \sim E_p(E_{p-1} \cdots E_1A)=\boldsymbol I_n

A∼E1​A∼E2​(E1​A)∼⋯∼Ep​(Ep−1​⋯E1​A)=In​ 即:

E

p

E

p

1

E

1

A

=

I

n

E_pE_{p-1} \cdots E_1A=\boldsymbol I_n

Ep​Ep−1​⋯E1​A=In​ 因为

E

p

E

1

E_p \cdots E_1

Ep​⋯E1​是可逆矩阵的乘积,因此其也是可逆矩阵(这点可以参考上述的两点知识:1. 初等矩阵是可逆的;2. 如果两个矩阵是可逆的,那么两个矩阵的乘积也是可逆的),那么可以根据上式推出:

(

E

p

E

1

)

1

(

E

p

E

1

)

A

=

(

E

p

E

1

)

1

I

n

A

=

(

E

p

E

1

)

1

\begin{aligned} (E_p \cdots E_1)^{-1}(E_p \cdots E_1)A &= (E_p \cdots E_1)^{-1}\boldsymbol I_n \\ A &= (E_p \cdots E_1)^{-1} \end{aligned}

(Ep​⋯E1​)−1(Ep​⋯E1​)AA​=(Ep​⋯E1​)−1In​=(Ep​⋯E1​)−1​ 这说明了

A

A

A是可逆矩阵

E

p

E

1

E_p \cdots E_1

Ep​⋯E1​的逆,又由于上述定理所述(可逆矩阵的逆矩阵也可逆),有:

A

1

=

[

(

E

p

E

1

)

1

]

1

=

E

p

E

1

A^{-1} = [(E_p \cdots E_1)^{-1}]^{-1} = E_p \cdots E_1

A−1=[(Ep​⋯E1​)−1]−1=Ep​⋯E1​

由上述定理的证明过程,自然而然可以引出计算矩阵逆矩阵的一种方法:

A

A

A和

I

\boldsymbol I

I排在一起构成增广矩阵

[

A

I

]

\begin{bmatrix}A & \boldsymbol I\end{bmatrix}

[A​I​],则对此矩阵进行行变换时,

A

A

A和

I

\boldsymbol I

I收到同一变换。要么有一系列的行变换把

A

A

A变成

I

\boldsymbol I

I,同时把

I

\boldsymbol I

I变成

A

1

A^{-1}

A−1,要么

A

A

A是不可逆的。

精确描述如下:

把增广矩阵

[

A

I

]

\begin{bmatrix}A & \boldsymbol I\end{bmatrix}

[A​I​]进行行化简。若

A

A

A行等价于

I

\boldsymbol I

I,则

[

A

I

]

\begin{bmatrix}A & \boldsymbol I\end{bmatrix}

[A​I​]行等价于

[

I

A

1

]

\begin{bmatrix}\boldsymbol I & A^{-1}\end{bmatrix}

[I​A−1​],否则

A

A

A没有逆。

例:

求矩阵

A

=

[

0

1

2

1

0

3

4

3

8

]

A = \begin{bmatrix}0 & 1 & 2 \\ 1 & 0 & 3 \\ 4 & -3 & 8\end{bmatrix}

A=⎣⎡​014​10−3​238​⎦⎤​的逆,假如它存在。

解:

[

A

I

]

=

[

0

1

2

1

0

0

1

0

3

0

1

0

4

3

8

0

0

1

]

[

1

0

0

9

/

2

7

3

/

2

0

1

0

2

4

1

0

0

1

3

/

2

2

1

/

2

]

\begin{aligned} \begin{bmatrix}A & \boldsymbol I\end{bmatrix} &=\begin{bmatrix}0 & 1 & 2 & 1 & 0 & 0 \\ 1 & 0 & 3 & 0 & 1 & 0 \\4 & -3 & 8 & 0 & 0 & 1\end{bmatrix} \\ &\sim \begin{bmatrix}1 & 0 & 0 & -9/2 & 7 & -3/2 \\ 0 & 1 & 0 & -2 & 4 & -1\\ 0 & 0 & 1 & 3/2 & -2 & 1/2\end{bmatrix} \end{aligned}

[A​I​]​=⎣⎡​014​10−3​238​100​010​001​⎦⎤​∼⎣⎡​100​010​001​−9/2−23/2​74−2​−3/2−11/2​⎦⎤​​ 由上述定理,可知

A

A

A可逆,且:

A

1

=

[

9

/

2

7

3

/

2

2

4

1

3

/

2

2

1

/

2

]

A^{-1} = \begin{bmatrix}-9/2 & 7 & -3/2 \\ -2 & 4 & -1 \\3/2 & -2 & 1/2\end{bmatrix}

A−1=⎣⎡​−9/2−23/2​74−2​−3/2−11/2​⎦⎤​

可逆矩阵的另一个观点

假设

A

A

A可逆,那么有:

A

A

1

=

I

AA^{-1} = \boldsymbol I

AA−1=I。由矩阵乘法的定义,

A

A

A乘以

A

1

A^{-1}

A−1,就是用

A

A

A去乘以

A

1

A^{-1}

A−1的每一列。假设

A

1

A^{-1}

A−1的每一行按序号为

x

i

\boldsymbol x_i

xi​,那么有:

[

A

x

1

A

x

2

A

x

n

]

=

[

e

1

e

2

e

n

]

\begin{bmatrix}A\boldsymbol x_1 & A\boldsymbol x_2 & \cdots & A\boldsymbol x_n\end{bmatrix} = \begin{bmatrix}\boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end{bmatrix}

[Ax1​​Ax2​​⋯​Axn​​]=[e1​​e2​​⋯​en​​]。要求解逆矩阵

A

1

A^{-1}

A−1的某一列

x

i

\boldsymbol x_i

xi​,只需要求解方程

A

x

i

=

e

i

A\boldsymbol x_i = \boldsymbol e_i

Axi​=ei​ 即可。这一点是很有用的,因为在某些问题中,只需要

A

1

A^{-1}

A−1的一列或两列。