行列式 是數學 中的一個函數 ,將一個
n
×
n
{\displaystyle n\times n}
的矩陣
A
{\displaystyle A}
映射到一個純量 ,記作
det
(
A
)
{\displaystyle \det(A)}
或
|
A
|
{\displaystyle |A|}
。行列式可以看做是有向 面積 或體積 的概念在一般的歐幾里得空間 中的推廣。或者說,在
n
{\displaystyle n}
維 歐幾里得空間中,行列式描述的是一個線性變換 對「體積」所造成的影響。無論是在線性代數 、多項式 理論,還是在微積分學 中(比如說換元積分法 中),行列式作為基本的數學工具,都有着重要的應用。
行列式概念最早出現在解線性方程組 的過程中。十七世紀晚期,關孝和 與萊布尼茨 的著作中已經使用行列式來確定線性方程組解的個數以及形式。十八世紀開始,行列式開始作為獨立的數學概念被研究。十九世紀以後,行列式理論進一步得到發展和完善。矩陣 概念的引入使得更多有關行列式的性質被發現,行列式在許多領域都逐漸顯現出重要的意義和作用,出現了線性自同態 和向量組 的行列式的定義。
行列式的本質可以被概括為一個交替多線性形式 ,這個本質使得行列式在歐幾里德空間中可以成為描述「體積」的函數[ 1] :92 。
豎直線記法
矩陣A 的行列式記作det(A )或|A |。有些著作中,矩陣範數 也使用|A |的記法,有可能和行列式的記法混淆。不過,在大部分涉及行列式的地方,為了區別,通常會用雙垂線表示矩陣的範數,或者在垂線記法中使用下標,標明範數性質,而行列式的垂線記法是不會有下標的。在不至於混淆的上下文中,經常使用垂線記法表記行列式。而當明確寫出矩陣元素的時候,一般使用垂線記法。
例如若有矩陣
A
=
[
a
b
c
d
e
f
g
h
i
]
{\displaystyle A={\begin{bmatrix}a&b&c\\d&e&f\\g&h&i\end{bmatrix}}}
,則其行列式
det
(
A
)
{\displaystyle \det(A)}
不僅可以寫作
|
A
|
{\displaystyle |A|}
,也可以明確寫作
|
a
b
c
d
e
f
g
h
i
|
.
{\displaystyle {\begin{vmatrix}a&b&c\\d&e&f\\g&h&i\end{vmatrix}}.}
即把矩陣的方括號以細長的垂線取代,表示該矩陣的行列式[ 2] :2-5 [ 3] :38 。
簡單例子
對於簡單的2階和3階的矩陣,行列式的表達式相對簡單,而且恰好是每條主對角線 (左上至右下)元素乘積之和減去每條副對角線(右上至左下)元素乘積之和(見圖中紅線和藍線)。
2階矩陣的行列式:
|
a
11
a
12
a
21
a
22
|
=
a
11
a
22
−
a
12
a
21
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}}=a_{11}a_{22}-a_{12}a_{21}}
[ 4] :34
3階矩陣的行列式:
|
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
|
=
a
11
a
22
a
33
+
a
12
a
23
a
31
+
a
13
a
21
a
32
−
a
13
a
22
a
31
−
a
11
a
23
a
32
−
a
12
a
21
a
33
{\displaystyle \displaystyle {\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}}=a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}-a_{13}a_{22}a_{31}-a_{11}a_{23}a_{32}-a_{12}a_{21}a_{33}}
[ 4] :35
三階矩陣的行列式為每條紅線上的元素的乘積之和,減去藍線上元素乘積之和。
直觀幾何意義
行列式的一個自然的源起是n 維平行體的體積。行列式的定義和n 維平行體的體積有着本質上的關聯[ 1] :92 。在二維與三維實 歐幾里德空間 中,可以直觀地感受到這種關聯。
平行四邊形的面積
行列式是向量形成的平行四邊形的面積
在一個二維平面 上,考慮兩個向量
X
1
=
(
x
1
,
y
1
)
{\displaystyle X_{1}=(x_{1},y_{1})}
和
X
2
=
(
x
2
,
y
2
)
{\displaystyle X_{2}=(x_{2},y_{2})}
。以它們為鄰邊,可以確定一個平行四邊形
D
X
1
,
X
2
{\displaystyle D_{X_{1},X_{2}}}
。定義平行四邊形的有向面積為:如果以原點 為軸點將
X
1
{\displaystyle X_{1}}
逆時針轉動到
X
2
{\displaystyle X_{2}}
所在方向時,經過平行四邊形內部,則平行四邊形面積為正,否則為負。則經計算可知,平行四邊形
D
X
1
,
X
2
{\displaystyle D_{X_{1},X_{2}}}
的有向面積是
S
(
D
X
1
,
X
2
)
=
x
1
y
2
−
x
2
y
1
{\displaystyle S(D_{X_{1},X_{2}})=x_{1}y_{2}-x_{2}y_{1}}
,正等於以
X
1
{\displaystyle X_{1}}
和
X
2
{\displaystyle X_{2}}
為列向量構成的矩陣的行列式:{r|hme|page1=34}}
det
(
X
1
,
X
2
)
=
|
x
1
x
2
y
1
y
2
|
=
x
1
y
2
−
x
2
y
1
.
{\displaystyle \det(X_{1},X_{2})={\begin{vmatrix}x_{1}&x_{2}\\y_{1}&y_{2}\end{vmatrix}}=x_{1}y_{2}-x_{2}y_{1}.}
比如說,兩個向量
X
1
=
(
2
,
1
)
{\displaystyle X_{1}=(2,1)}
和
X
2
=
(
3
,
4
)
{\displaystyle X_{2}=(3,4)}
構成的平行四邊形,它的有向面積是:
det
(
X
1
,
X
2
)
=
|
2
3
1
4
|
=
2
⋅
4
−
3
⋅
1
=
5.
{\displaystyle \det(X_{1},X_{2})={\begin{vmatrix}2&3\\1&4\end{vmatrix}}=2\cdot 4-3\cdot 1=5.}
如果兩個向量處在同一直線上,則它們的係數成比例,也就是說,存在不全為零的係數a,b 使得
a
x
1
=
b
x
2
,
a
y
1
=
b
y
2
{\displaystyle ax_{1}=bx_{2},\,ay_{1}=by_{2}}
。這時
a
(
x
1
y
2
−
x
2
y
1
)
=
a
x
1
⋅
y
2
−
x
2
⋅
a
y
1
=
b
x
2
y
2
−
x
2
b
y
2
=
0
=
x
1
a
y
1
−
a
x
1
y
1
=
x
1
⋅
b
y
2
−
b
x
2
⋅
y
1
=
b
(
x
1
y
2
−
x
2
y
1
)
.
{\displaystyle {\begin{aligned}a(x_{1}y_{2}-x_{2}y_{1})&=ax_{1}\cdot y_{2}-x_{2}\cdot ay_{1}=bx_{2}y_{2}-x_{2}by_{2}=0\\&=x_{1}ay_{1}-ax_{1}y_{1}=x_{1}\cdot by_{2}-bx_{2}\cdot y_{1}=b(x_{1}y_{2}-x_{2}y_{1}).\end{aligned}}}
所以行列式
x
1
y
2
−
x
2
y
1
=
0
{\displaystyle x_{1}y_{2}-x_{2}y_{1}=0}
。幾何直觀上,平行四邊形退化成線段,面積為零。
平行六面體的體積
在三維的有向空間 中,考慮三個三維向量
X
1
=
(
x
1
,
y
1
,
z
1
)
{\displaystyle X_{1}=(x_{1},y_{1},z_{1})}
、
X
2
=
(
x
2
,
y
2
,
z
2
)
{\displaystyle X_{2}=(x_{2},y_{2},z_{2})}
和
X
3
=
(
x
3
,
y
3
,
z
3
)
{\displaystyle X_{3}=(x_{3},y_{3},z_{3})}
。它們可以確定一個平行六面體
D
X
1
,
X
2
,
X
3
{\displaystyle D_{X_{1},X_{2},X_{3}}}
。假設空間的定向遵循右手定則 ,則經計算可知,這個平行六面體的有向體積為
V
(
D
X
1
,
X
2
,
X
3
)
=
x
1
y
2
z
3
+
x
2
y
3
z
1
+
x
3
y
1
z
2
−
x
1
y
3
z
2
−
x
2
y
1
z
3
−
x
3
y
2
z
1
{\displaystyle V(D_{X_{1},X_{2},X_{3}})=x_{1}y_{2}z_{3}+x_{2}y_{3}z_{1}+x_{3}y_{1}z_{2}-x_{1}y_{3}z_{2}-x_{2}y_{1}z_{3}-x_{3}y_{2}z_{1}}
,正等於以
X
1
{\displaystyle X_{1}}
、
X
2
{\displaystyle X_{2}}
和
X
3
{\displaystyle X_{3}}
為列向量構成的矩陣的行列式。
det
(
X
1
,
X
2
,
X
3
)
=
|
x
1
x
2
x
3
y
1
y
2
y
3
z
1
z
2
z
3
|
=
x
1
y
2
z
3
+
x
2
y
3
z
1
+
x
3
y
1
z
2
−
x
1
y
3
z
2
−
x
2
y
1
z
3
−
x
3
y
2
z
1
.
{\displaystyle \det(X_{1},X_{2},X_{3})={\begin{vmatrix}x_{1}&x_{2}&x_{3}\\y_{1}&y_{2}&y_{3}\\z_{1}&z_{2}&z_{3}\end{vmatrix}}=x_{1}y_{2}z_{3}+x_{2}y_{3}z_{1}+x_{3}y_{1}z_{2}-x_{1}y_{3}z_{2}-x_{2}y_{1}z_{3}-x_{3}y_{2}z_{1}.}
[ 4] :35
比如,三個向量
X
1
=
(
2
,
1
,
5
)
{\displaystyle X_{1}=(2,1,5)}
、
X
2
=
(
6
,
0
,
8
)
{\displaystyle X_{2}=(6,0,8)}
和
X
3
=
(
3
,
2
,
4
)
{\displaystyle X_{3}=(3,2,4)}
確定的平行六面體的體積是:
det
(
X
1
,
X
2
,
X
3
)
=
|
2
6
3
1
0
2
5
8
4
|
=
2
⋅
0
⋅
4
+
6
⋅
2
⋅
5
+
3
⋅
1
⋅
8
−
2
⋅
2
⋅
8
−
6
⋅
1
⋅
4
−
3
⋅
0
⋅
5
=
28
{\displaystyle \det(X_{1},X_{2},X_{3})={\begin{vmatrix}2&6&3\\1&0&2\\5&8&4\end{vmatrix}}=2\cdot 0\cdot 4+6\cdot 2\cdot 5+3\cdot 1\cdot 8-2\cdot 2\cdot 8-6\cdot 1\cdot 4-3\cdot 0\cdot 5=28}
基底的選擇
在以上的例子中,我們不加選擇地將向量在所謂的正交基 (即直角坐標系 )下分解,實際上在不同的基底 之下,行列式的值並不相同。這並不表示平行四邊形或平行六面體的體積不唯一。恰恰相反,它說明了面積和體積的概念依賴于衡量空間的尺度,也就是基底的選取方式。不同基底之間的變換可以看作作用在基底上的線性映射 ,而不同基底下的行列式代表了基底變換映射 對向量組構成的平行體體積的影響。可以證明,對於所有同定向的標準正交基 ,向量組的行列式是一樣的。而不同定向的正交基只會改變行列式的符號[ 3] :283 。只要選擇的基底都是「單位長度」,並且兩兩正交 ,那麼在這樣的基底下,向量組所構成平行體體積的絕對值是同一個[ 5] :136-140 。
線性變換
經線性映射後的正方體
設E 是一個一般的n 維的有向歐幾里得空間 。一個線性變換把一個向量線性地變為另一個向量。比如說,在三維空間中,向量(x, y, z )被映射到向量(x', y', z' ):
x
′
=
a
1
x
+
b
1
y
+
c
1
z
y
′
=
a
2
x
+
b
2
y
+
c
2
z
z
′
=
a
3
x
+
b
3
y
+
c
3
z
{\displaystyle {\begin{matrix}x'=a_{1}x+b_{1}y+c_{1}z\\y'=a_{2}x+b_{2}y+c_{2}z\\z'=a_{3}x+b_{3}y+c_{3}z\end{matrix}}}
其中a 、b 、c 是係數。如右圖,正方體(可以看作原來的一組基形成的)經線性變換後可以變成一個普通的平行六面體,或變成一個平行四邊形(沒有體積)。這兩種情況表示了兩種不同的線性變換,行列式可以將其很好地分辨出來(為零或不為零)。
更詳細地說,行列式表示的是線性變換前後平行六面體的體積的變化係數。如果設左邊的正方體體積是一,那麼中間的平行六面體的(有向)體積就是線性變換的行列式的值,右邊的平行四邊形體積為零,同時可以通過計算得出線性變換的行列式為零。這裏我們混淆了線性變換的行列式和向量組的行列式,但兩者是一樣的,因為我們在對基底作變換[ 6] :234-235 。
行列式與空間定向
二維和三維行列式的例子中,行列式被解釋為向量形成的圖形的面積或體積。面積或體積的定義是恆正的,而行列式是有正有負的,因此需要引入有向面積和有向體積的概念。負的面積或體積在物理學中可能難以理解,但在數學中,它們和有向角 的概念類似,都是對空間鏡面對稱特性的一種刻畫。如果行列式表示的是線性變換對體積的影響,那麼行列式的正負就表示了空間的定向[ 5] :132 。
如上圖中,左邊的黃色骰子(可以看成有單位的有向體積的物體)在經過了線性變換後變成中間綠色的平行六面體,這時行列式為正,兩者是同定向的 ,可以通過旋轉和拉伸從一個變成另一個。而骰子和右邊的紅色平行六面體之間也是通過線性變換得到的,但是無論怎樣旋轉和拉伸,都無法使一個變成另一個,一定要通過鏡面反射才行。這時兩者之間的線性變換的行列式是負的。可以看出,線性變換可以分為兩類,一類對應着正的行列式,保持空間的定向不變,另一類對應負的行列式,顛倒空間的定向[ 5] :132 [ 1] :92-93 [ 7] 。
嚴格的定義
由二維及三維的例子,可以看到一般域上的行列式應該具有怎樣的性質。在n 維歐幾里得空間中,作為n 個向量構成的「平行多面體」的「體積」的概念的推廣,行列式繼承了「體積」函數的性質。首先,行列式需要是線性 的,這可以由面積和體積的性質類比得到。這裏的線性是對於每一個向量來說的,因為當一個向量變為原來的k 倍時,「平行多面體」的「體積」也變為原來的k 倍。其次,當一個向量在其它向量組成的「超平面 」上時,n 維「平行多面體」的「體積」是零(可以想像三維空間的例子)。也就是說,當向量線性相關 時,行列式為零。在一般係數域上的線性空間中,符合這樣特性的函數叫做交替多線性形式:
設有係數域為K 的n 維線性空間 E 。E 上的交替n- 線性形式 是指滿足以下性質的函數
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
[ 5] :102 :
n -線性:對任意的係數
k
∈
K
{\displaystyle k\in K}
以及任意一個下標
i
∈
{
1
,
2
,
⋯
,
n
}
{\displaystyle i\in \{1,2,\cdots ,n\}}
,都有
D
(
a
1
,
⋯
,
k
a
i
+
a
i
′
,
⋯
,
a
n
)
=
k
D
(
a
1
,
⋯
,
a
i
,
⋯
,
a
n
)
+
D
(
a
1
,
⋯
,
a
i
′
,
⋯
,
a
n
)
,
{\displaystyle D(a_{1},\cdots ,ka_{i}+a_{i}',\cdots ,a_{n})=kD(a_{1},\cdots ,a_{i},\cdots ,a_{n})+D(a_{1},\cdots ,a_{i}',\cdots ,a_{n}),}
交替性:如果
a
i
=
a
j
{\displaystyle a_{i}=a_{j}}
,那麼
D
(
a
1
,
⋯
,
a
i
,
⋯
,
a
j
,
⋯
,
a
n
)
=
0.
{\displaystyle D(a_{1},\cdots ,a_{i},\cdots ,a_{j},\cdots ,a_{n})=0.}
由這兩個性質可以直接推出:如果n 個向量中的某一個可以通過其餘向量的線性組合表示:
a
i
=
∑
j
≠
i
ω
j
a
j
{\displaystyle a_{i}=\sum _{j\neq i}\omega _{j}a_{j}}
,則:
D
(
a
1
,
a
2
,
⋯
,
a
i
,
⋯
,
a
n
)
=
D
(
a
1
,
⋯
,
∑
j
≠
i
ω
j
a
j
,
⋯
,
a
n
)
=
∑
j
≠
i
ω
j
D
(
a
1
,
⋯
,
a
j
,
⋯
,
a
j
,
⋯
,
a
n
)
=
0
{\displaystyle D(a_{1},a_{2},\cdots ,a_{i},\cdots ,a_{n})=D(a_{1},\cdots ,\sum _{j\neq i}\omega _{j}a_{j},\cdots ,a_{n})=\sum _{j\neq i}\omega _{j}D(a_{1},\cdots ,a_{j},\cdots ,a_{j},\cdots ,a_{n})=0}
這正符合對「體積」概念的刻畫。
所有E 上的交替n- 線性形式的集合記作An (E )。可以證明,An (E )的維度是1,其中所有的元素都可以表達成某個元素的倍數。
基底下向量組的行列式
如果給定E 的一個基底
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
,則可以為E 上的交替n- 線性形式進行具體刻畫。所有的交替n- 線性形式
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
都可以寫成
D
=
ν
D
⋅
ω
B
{\displaystyle D=\nu _{D}\cdot \operatorname {\omega } _{B}}
的形式。其中的
ν
D
∈
K
{\displaystyle \nu _{D}\in K}
是一個只與D 有關的係數,
ω
B
{\displaystyle \omega _{B}}
是一個固定的交替n- 線性形式:
∀
(
a
1
,
⋯
,
a
n
)
∈
E
n
,
ω
B
(
a
1
,
⋯
,
a
n
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
j
=
1
n
a
σ
(
j
)
,
j
∈
K
{\displaystyle \forall (a_{1},\cdots ,a_{n})\in E^{n},\,\,\operatorname {\omega } _{B}(a_{1},\cdots ,a_{n})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{j=1}^{n}a_{\sigma (j),j}\in K}
其中
a
j
=
∑
i
=
1
n
a
i
,
j
e
i
{\displaystyle a_{j}=\sum _{i=1}^{n}a_{i,j}e_{i}}
是
a
j
{\displaystyle a_{j}}
在基底
B
{\displaystyle B}
下的展開[ 3] :43-46 [ 5] :102 。
證明 :
對任一個n- 線性形式
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
,對給定的
a
∈
K
{\displaystyle a\in K}
,考慮將D (a )依照多線性性質展開:
D
(
a
)
=
D
(
a
1
,
⋯
,
a
n
)
=
D
(
∑
i
1
=
1
n
a
i
1
,
1
e
i
1
,
…
,
∑
i
n
=
1
n
a
i
n
,
n
e
i
n
)
=
∑
i
1
=
1
n
⋯
∑
i
n
=
1
n
∏
j
=
1
n
a
i
j
,
j
D
(
e
i
1
,
…
,
e
i
n
)
{\displaystyle D(a)=D(a_{1},\cdots ,a_{n})=D\left(\sum _{i_{1}=1}^{n}a_{i_{1},1}e_{i_{1}},\dots ,\sum _{i_{n}=1}^{n}a_{i_{n},n}e_{i_{n}}\right)=\sum _{i_{1}=1}^{n}\cdots \sum _{i_{n}=1}^{n}\prod _{j=1}^{n}a_{i_{j},j}D(e_{i_{1}},\dots ,e_{i_{n}})}
這時,由交替性,
D
(
e
i
1
,
⋯
,
e
i
n
)
≠
0
{\displaystyle D(e_{i_{1}},\cdots ,e_{i_{n}})\neq 0}
若且唯若
i
1
,
⋯
,
i
n
{\displaystyle i_{1},\cdots ,i_{n}}
是
1
,
⋯
,
n
{\displaystyle 1,\cdots ,n}
的一個排列,所以有
D
(
a
1
,
⋯
,
a
n
)
=
∑
(
i
1
,
⋯
,
i
n
)
=
σ
(
1
,
2
,
⋯
,
n
)
σ
∈
S
n
∏
j
=
1
n
a
i
j
,
j
D
(
e
i
1
,
⋯
,
e
i
n
)
=
∑
σ
∈
S
n
∏
j
=
1
n
a
σ
(
j
)
,
j
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
{\displaystyle D(a_{1},\cdots ,a_{n})=\sum _{{(i_{1},\cdots ,i_{n})=\sigma (1,2,\cdots ,n)} \atop {\sigma \in {\mathfrak {S}}_{n}}}\prod _{j=1}^{n}a_{i_{j},j}D(e_{i_{1}},\cdots ,e_{i_{n}})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\prod _{j=1}^{n}a_{\sigma (j),j}D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})}
從交替性還可以推出,
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
{\displaystyle D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})}
和
D
(
e
1
,
⋯
,
e
n
)
{\displaystyle D(e_{1},\cdots ,e_{n})}
之間只相差一個正負號,因此可以將每一個
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
{\displaystyle D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})}
寫作一個符號係數與
D
(
e
1
,
⋯
,
e
n
)
{\displaystyle D(e_{1},\cdots ,e_{n})}
的乘積:
∀
σ
∈
S
n
,
∃
ϵ
σ
∈
{
+
1
,
−
1
}
,
{\displaystyle \forall \sigma \in {\mathfrak {S}}_{n},\,\,\exists \epsilon _{\sigma }\in \{+1,-1\},}
使得
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
=
ϵ
σ
D
(
e
1
,
⋯
,
e
n
)
,
{\displaystyle D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})=\epsilon _{\sigma }D(e_{1},\cdots ,e_{n}),}
而其中的符號係數
ϵ
σ
{\displaystyle \epsilon _{\sigma }}
取決於將排列
(
σ
(
1
)
,
σ
(
2
)
,
⋯
,
σ
(
n
)
)
{\displaystyle (\sigma (1),\sigma (2),\cdots ,\sigma (n))}
經過兩個元素的「對調」變換得到
(
1
,
2
,
⋯
,
n
)
{\displaystyle (1,2,\cdots ,n)}
所需要的次數。根據群論 中的相關定理 可知,這個次數的奇偶性是由
σ
{\displaystyle \sigma }
本身唯一確定的。如果需要偶數 次,則
ϵ
σ
=
1
{\displaystyle \epsilon _{\sigma }=1}
;如果需要奇數次,則
ϵ
σ
=
−
1
{\displaystyle \epsilon _{\sigma }=-1}
。這個係數
ϵ
σ
{\displaystyle \epsilon _{\sigma }}
在群論中被記為
sgn
(
σ
)
{\displaystyle \operatorname {sgn}(\sigma )}
,所以D (a )最終可以表示為:
D
(
a
1
,
⋯
,
a
n
)
=
D
(
e
1
,
⋯
,
e
n
)
⋅
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
σ
(
i
)
,
i
=
ν
D
ω
B
{\displaystyle {\begin{aligned}D(a_{1},\cdots ,a_{n})&=D(e_{1},\cdots ,e_{n})\cdot \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i),i}\\&=\nu _{D}\operatorname {\omega } _{B}\end{aligned}}}
這裏,
ν
D
=
D
(
e
1
,
⋯
,
e
n
)
{\displaystyle \nu _{D}=D(e_{1},\cdots ,e_{n})}
是一個僅和D 有關的係數,
ω
B
:
(
a
1
,
⋯
,
a
n
)
↦
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
σ
(
i
)
,
i
{\displaystyle \operatorname {\omega } _{B}:\,(a_{1},\cdots ,a_{n})\mapsto \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i),i}}
是一個固定的交替n- 線性形式。
設
B
=
(
e
1
,
⋯
,
e
n
)
{\displaystyle B=(e_{1},\cdots ,e_{n})}
是E 的一個基底,基底B 下的行列式函數 就是上述證明中的
ω
B
{\displaystyle \operatorname {\omega } _{B}}
。
定義 :
E 上的一個基底
B
=
(
e
1
,
⋯
,
e
n
)
{\displaystyle {\mathit {B}}=(e_{1},\cdots ,e_{n})}
下的行列式函數是唯一 一個滿足:
det
B
(
e
1
,
⋯
,
e
n
)
=
1
{\displaystyle \det {}_{\mathit {B}}(e_{1},\cdots ,e_{n})=1}
的交替n- 線性形式
det
B
:
E
n
→
K
{\displaystyle \det {}_{\mathit {B}}:E^{n}\to K}
。其具體形式為:
det
B
:
(
a
1
,
⋯
,
a
n
)
↦
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
σ
(
i
)
,
i
{\displaystyle \det {}_{B}:\,(a_{1},\cdots ,a_{n})\mapsto \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i),i}}
其中
a
j
=
∑
i
=
1
n
a
i
,
j
e
i
{\displaystyle a_{j}=\sum _{i=1}^{n}a_{i,j}e_{i}}
是
a
j
{\displaystyle a_{j}}
在基底
B
{\displaystyle B}
下的展開[ 8] :387-388 。
向量組行列式的直觀表達式有時也被稱作萊布尼茲公式 。
設B 與B′ 是向量空間中的兩個基底,則向量組在兩個基底上的行列式之間的關係為:
det
B
′
(
a
1
,
…
,
a
n
)
=
det
B
′
(
B
)
×
det
B
(
a
1
,
…
,
a
n
)
{\displaystyle \det {}_{B'}(a_{1},\dots ,a_{n})=\det {}_{B'}(B)\times \det {}_{B}(a_{1},\dots ,a_{n})}
矩陣的行列式
設
M
n
(
K
)
{\displaystyle \displaystyle {\mathfrak {M}}_{n}(K)}
為所有定義在係數域 K 上的
n
×
n
{\displaystyle n\times n}
矩陣的集合。將
n
×
n
{\displaystyle n\times n}
矩陣M (M 的元素記為
m
i
,
j
{\displaystyle \displaystyle m_{i,j}}
)的n 列寫成
m
1
,
…
,
m
n
{\displaystyle m_{1},\ldots ,m_{n}}
,
m
j
=
(
m
i
j
)
1
≤
i
≤
n
{\displaystyle \displaystyle m_{j}=\left(m_{ij}\right)_{1\leq i\leq n}}
可以看作是
R
n
{\displaystyle \mathbb {R} ^{n}}
的向量在
R
n
{\displaystyle \mathbb {R} ^{n}}
的正則基
B
c
{\displaystyle B^{c}}
上的分解。矩陣M 的行列式定義為向量組
m
1
,
…
,
m
n
{\displaystyle m_{1},\ldots ,m_{n}}
的行列式。
定義 :
矩陣M 的行列式
det
(
M
)
=
det
B
c
(
m
1
,
…
,
m
n
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
m
σ
(
i
)
,
i
{\displaystyle \det(M)=\det {}_{B^{c}}(m_{1},\ldots ,m_{n})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}m_{\sigma (i),i}}
[ 5] :109
由萊布尼茲公式,可以證明矩陣行列式的一個重要性質:
定理 :
一個矩陣的行列式等於它的轉置矩陣 的行列式:
det
M
=
det
(
t
M
)
{\displaystyle \det M=\det \left({}^{t}{M}\right)}
。[ 8] :405-406
也就是說矩陣的行列式既可以看作n 個行向量 的行列式,也可以看作n 個列向量 的行列式。因此也可以通過行向量組來定義矩陣行列式,並且得到的定義是等價的。
自同態的行列式
設f 是n 維線性空間 E 到自身的線性變換(自同態 ),對於給定的基底,可以定義線性變換在這個基底下的行列式。
定義 :
設B 是E 的一個基底。設f 在B 下的變換矩陣 為
[
f
]
B
{\displaystyle \left[f\right]_{B}}
,那麼f 在B 下的行列式就是:
det
B
(
f
)
=
det
B
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
(
[
f
]
B
)
{\displaystyle \det {}_{B}(f)=\det {}_{B}(f(e_{1}),\cdots ,f(e_{n}))=\det \left([f]_{B}\right)}
。
因此,對向量組
(
x
1
,
…
,
x
n
)
{\displaystyle (x_{1},\dots ,x_{n})}
,有:
det
B
(
f
(
x
1
)
,
⋯
,
f
(
x
n
)
)
=
det
(
[
f
]
B
)
×
det
B
(
x
1
,
⋯
,
x
n
)
=
det
B
(
f
)
×
det
B
(
x
1
,
⋯
,
x
n
)
{\displaystyle \det {}_{B}(f(x_{1}),\cdots ,f(x_{n}))=\det \left([f]_{B}\right)\times \det {}_{B}(x_{1},\cdots ,x_{n})=\det {}_{B}(f)\times \det {}_{B}(x_{1},\cdots ,x_{n})}
。
可以證明,f 在E 的不同基底下的變換矩陣的行列式是相等的[ 5] :104 。
證明 :
考慮兩個不同的基底B 和B' 。
det
B
′
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
B
′
(
f
)
×
det
B
′
(
e
1
,
⋯
,
e
n
)
{\displaystyle \det {}_{B'}(f(e_{1}),\cdots ,f(e_{n}))=\det {}_{B'}(f)\times \det {}_{B'}(e_{1},\cdots ,e_{n})}
另一方面,由基變更公式可知:
det
B
′
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
B
′
(
e
1
,
⋯
,
e
n
)
×
det
B
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
B
′
(
e
1
,
⋯
,
e
n
)
×
det
B
(
f
)
.
{\displaystyle \det {}_{B'}(f(e_{1}),\cdots ,f(e_{n}))=\det {}_{B'}(e_{1},\cdots ,e_{n})\times \det {}_{B}(f(e_{1}),\cdots ,f(e_{n}))=\det {}_{B'}(e_{1},\cdots ,e_{n})\times \det {}_{B}(f).}
所以
det
B
′
(
f
)
=
det
B
(
f
)
{\displaystyle \det {}_{B'}(f)=\det {}_{B}(f)}
因此自同態的行列式定義可以修改為不依賴於基底的形式:
前一節里對正方體做線性變換時,
(
x
1
,
⋯
,
x
n
)
{\displaystyle (x_{1},\cdots ,x_{n})}
是原來的基底,
det
B
(
x
1
,
…
,
x
n
)
=
1
{\displaystyle \det {}_{B}(x_{1},\dots ,x_{n})=1}
,因此可以混淆向量組的行列式和線性變換的行列式[ 5] :102 。
行列式的係數
以上的定義中都假設矩陣的係數取自某個域 。實際上,行列式的定義與計算並不涉及除法。所以,矩陣的係數可以是任意的交換環 k 的元素。這時有限維線性空間變為以
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
為基的自由k- 模 ,而相應的關於行列式的定義和性質依然成立(在可定義的範疇內)。如果矩陣係數是非交換環的話,以上的行列式定義將不再唯一。1845年,阿瑟·凱萊 首次開始研究非交換環上行列式定義的問題。他注意到,對於係數是四元數 (不可交換)的二階行列式
|
a
11
a
12
a
21
a
22
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\\\end{vmatrix}}}
表達式
a
11
a
22
−
a
12
a
21
{\displaystyle a_{11}a_{22}-a_{12}a_{21}}
和
a
11
a
22
−
a
21
a
12
{\displaystyle a_{11}a_{22}-a_{21}a_{12}}
是不一樣的。1913年,韋德伯恩開始發展非交換環上的行列式理論。1926年,阿蘭德·海廷 和A.理查德森提出了非交換除環上的行列式的不同定義。理查德森將二階行列式定義為:
(
a
11
−
a
12
a
22
−
1
a
21
)
a
22
{\displaystyle (a_{11}-a_{12}a_{22}^{-1}a_{21})a_{22}}
,而海廷則提倡使用
(
a
11
−
a
12
a
22
−
1
a
21
)
{\displaystyle (a_{11}-a_{12}a_{22}^{-1}a_{21})}
。兩人都用歸納法定義了更高階矩陣的行列式。1931年,奧斯丁·歐爾 在一大類非交換環(後來命名為歐爾環 )上定義了行列式的概念。最著名的非交換環上的行列式的定義當屬讓·迪厄多內 的定義。迪厄多內是布爾巴基學派 的代表成員之一,他將除環
K
{\displaystyle \mathbb {K} }
中的行列式定義在商域
K
/
[
K
,
K
]
{\displaystyle \mathbb {K} /[\mathbb {K} ,\mathbb {K} ]}
上,而不是在
K
{\displaystyle \mathbb {K} }
中。這個定義下的行列式有接近交換環中行列式的性質。例如,迪爾多內的行列式可以保持行列式的乘法定理。而這種行列式與交換環中行列式的區別是:將矩陣的兩行或兩列互換後,行列式的值不變。迪厄多內的行列式不能用來解線性方程組。[ 9] 之後菲列克斯·別列金 (Березин, Феликс Александрович )、佐藤幹夫 等人對迪厄多內的定義進行了探究和擴展[ 10] 。1991年起,I·傑爾方德和V·里塔克提出了准行列式 的概念,將一般自由除環上的n × n 矩陣的行列式定義為n × n 個數,分別是:
|
A
|
i
,
j
=
a
i
,
j
−
(
a
i
,
1
a
i
,
2
⋯
a
i
,
n
)
⋅
A
i
,
j
−
1
⋅
(
a
1
,
j
a
2
,
j
⋮
a
n
,
j
)
{\displaystyle |A|_{i,j}=a_{i,j}-{\begin{pmatrix}a_{i,1}&a_{i,2}&\cdots &a_{i,n}\end{pmatrix}}\cdot A_{i,j}^{-1}\cdot {\begin{pmatrix}a_{1,j}\\a_{2,j}\\\vdots \\a_{n,j}\end{pmatrix}}}
其中的
A
i
,
j
−
1
{\displaystyle A_{i,j}^{-1}}
指第i 行第j 列元素對應的余因式的逆矩陣。由定義本身可知,這個定義僅當
A
i
,
j
−
1
{\displaystyle A_{i,j}^{-1}}
存在時有效。如此定義的准行列式可以用來解線性方程組。[ 11]
行列式的性質
行列式的一些基本性質,可以由它的多線性以及交替性定義推出。
在行列式中,一行(列)元素全為0,則此行列式的值為0[ 2] :7-11 。
|
0
0
…
0
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
0
a
12
…
a
1
n
0
a
22
…
a
2
n
⋮
⋮
⋱
⋮
0
a
n
2
…
a
n
n
|
=
0
{\displaystyle {\begin{vmatrix}{\color {blue}0}&{\color {blue}0}&\dots &{\color {blue}0}\\a_{21}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}{\color {blue}0}&a_{12}&\dots &a_{1n}\\{\color {blue}0}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\{\color {blue}0}&a_{n2}&\dots &a_{nn}\end{vmatrix}}=0}
在行列式中,某一行(列)有公因子k ,則可以提出k [ 2] :7-11 。
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
k
a
i
1
k
a
i
2
…
k
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
k
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {blue}k}a_{i1}&{\color {blue}k}a_{i2}&\dots &{\color {blue}k}a_{in}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\color {blue}k}{\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}}
在行列式中,某一行(列)的每個元素是兩數之和,則此行列式可拆分為兩個相加的行列式[ 2] :7-11 。
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
a
i
1
+
b
i
1
a
i
2
+
b
i
2
…
a
i
n
+
b
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
+
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
b
i
1
b
i
2
…
b
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {blue}a_{i1}}+{\color {OliveGreen}b_{i1}}&{\color {blue}a_{i2}}+{\color {OliveGreen}b_{i2}}&\dots &{\color {blue}a_{in}}+{\color {OliveGreen}b_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}+{\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {OliveGreen}b_{i1}}&{\color {OliveGreen}b_{i2}}&\dots &{\color {OliveGreen}b_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}}
行列式中的兩行(列)互換,改變行列式正負符號[ 2] :7-11 。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
=
−
|
⋮
⋮
⋮
⋮
a
j
1
a
j
2
…
a
j
n
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\{\color {OliveGreen}a_{j1}}&{\color {OliveGreen}a_{j2}}&\dots &{\color {OliveGreen}a_{jn}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}=-{\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\{\color {OliveGreen}a_{j1}}&{\color {OliveGreen}a_{j2}}&\dots &{\color {OliveGreen}a_{jn}}\\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
在行列式中,有兩行(列)對應成比例或相同,則此行列式的值為0[ 2] :7-11 。
|
2
2
…
2
8
8
…
8
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
0
{\displaystyle {\begin{vmatrix}{\color {blue}2}&{\color {blue}2}&\dots &{\color {blue}2}\\{\color {blue}8}&{\color {blue}8}&\dots &{\color {blue}8}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}=0}
將一行(列)的k 倍加進另一行(列)裏,行列式的值不變[ 2] :7-11 。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
=
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
+
k
a
i
1
a
j
2
+
k
a
i
2
…
a
j
n
+
k
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}&a_{j2}&\dots &a_{jn}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}={\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}{\color {blue}+ka_{i1}}&a_{j2}{\color {blue}+ka_{i2}}&\dots &a_{jn}{\color {blue}+ka_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
注意 :一行(列)的k 倍加上 另一行(列),行列式的值改變。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
≠
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
k
a
j
1
+
a
i
1
k
a
j
2
+
a
i
2
…
k
a
j
n
+
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}&a_{j2}&\dots &a_{jn}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}{\color {red}\neq }{\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\{\color {red}k}a_{j1}{\color {red}+a_{i1}}&{\color {red}k}a_{j2}{\color {red}+a_{i2}}&\dots &{\color {red}k}a_{jn}{\color {red}+a_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
將矩陣的行列互換(轉置),其行列式的值不變[ 2] :7-11 [ 8] :405-406 。
|
a
11
a
12
…
a
1
n
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
a
11
a
21
…
a
n
1
a
12
a
22
…
a
n
2
⋮
⋮
⋱
⋮
a
1
n
a
2
n
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\a_{21}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}a_{11}&a_{21}&\dots &a_{n1}\\a_{12}&a_{22}&\dots &a_{n2}\\\vdots &\vdots &\ddots &\vdots \\a_{1n}&a_{2n}&\dots &a_{nn}\end{vmatrix}}}
行列式的乘法定理:方塊矩陣 的乘積的行列式等於行列式的乘積:
det
(
A
B
)
=
det
(
A
)
det
(
B
)
{\displaystyle \displaystyle \det(AB)=\det(A)\det(B)}
。特別的,若將矩陣中的每一行每一列上的數都乘以一個常數r ,那麼所得到的行列式不是原來的r 倍,而是rn 倍。
det
(
r
A
)
=
det
(
r
I
n
⋅
A
)
=
det
(
r
I
n
)
⋅
det
(
A
)
=
r
n
det
(
A
)
{\displaystyle \det(rA)=\det(rI_{n}\cdot A)=\det(rI_{n})\cdot \det(A)=r^{n}\det(A)}
[ 1] :89 。
以上的乘法公式還可以進一步推廣為柯西–比內公式 ,從而使得只要兩個矩陣的乘積是方塊矩陣,就有類似於以上的結果:假設A 是一個m ×n 矩陣,而B 是一個n ×m 矩陣。如果S 是
{
1
,
⋯
,
n
}
{\displaystyle \left\{1,\cdots ,n\right\}}
中某個有m 個元素的子集
S
=
{
s
1
,
⋯
,
s
m
}
{\displaystyle S=\left\{s_{1},\cdots ,s_{m}\right\}}
,記AS 為A 中列指標位於S 中的
m
×
m
{\displaystyle m\times m}
子矩陣。類似地,記BS 為B 中行指標位於S 中的m ×m 子矩陣。那麼
det
(
A
B
)
=
∑
S
det
(
A
S
)
det
(
B
S
)
{\displaystyle \det(AB)=\sum _{S}\det(A_{S})\det(B_{S})\,}
其中的求和號表示遍歷
{
1
,
⋯
,
n
}
{\displaystyle \left\{1,\cdots ,n\right\}}
中擁有m 個元素的所有子集S (共有C (n ,m ) 個)。
如果m = n ,即A 與B 是同樣大小的方塊矩陣,則只有一個容許集合 S ,柯西–比內公式退化為通常行列式的乘法公式。如過m = 1則有n 個容許集合S ,這個公式退化為點積 。如果m > n ,沒有容許集合S ,約定行列式det(AB )為零[ 12] 。
若A 是可逆矩陣 ,A 的逆矩陣的行列式等於A 的行列式的倒數:
det
(
A
−
1
)
=
(
det
(
A
)
)
−
1
{\displaystyle \displaystyle \det(A^{-1})=(\det(A))^{-1}}
[ 2] :65 。
由行列式的乘法定理以及逆矩陣的行列式可以知道,行列式定義了一個從一般線性群
(
G
L
n
(
F
)
,
×
)
{\displaystyle (GL_{n}(\mathbb {F} ),\times )}
到
(
F
∗
,
×
)
{\displaystyle (\mathbb {F} ^{*},\times )}
上的群同態 [ 13] 。
若將方塊矩陣中的元素取共軛 ,得到的是矩陣的共軛矩陣。共軛矩陣的行列式值等於矩陣行列式值的共軛:
det
(
A
¯
)
=
det
(
A
)
¯
{\displaystyle \det({\overline {A}})={\overline {\det(A)}}}
[ note 1]
若兩個矩陣相似 ,那麼它們的行列式相同。這是因為兩個相似的矩陣可以看作同一個自同態在不同基底下的變換矩陣,而基底變換並不會影響行列式的值。用數學語言來說,就是:
如果兩個矩陣A 與B 相似,那麼存在可逆矩陣P 使得
A
=
P
B
P
−
1
{\displaystyle \mathbf {A} =\mathbf {PB} \mathbf {P} ^{-1}}
,所以
det
(
A
)
=
det
(
P
B
P
−
1
)
=
det
(
P
)
⋅
det
(
B
)
⋅
det
(
P
−
1
)
=
det
(
B
)
⋅
det
(
P
)
⋅
det
(
P
)
−
1
=
det
(
B
)
{\displaystyle \det(\mathbf {A} )=\det(\mathbf {PB} \mathbf {P} ^{-1})=\det(\mathbf {P} )\cdot \det(\mathbf {B} )\cdot \det(\mathbf {P} ^{-1})=\det(\mathbf {B} )\cdot \det(\mathbf {P} )\cdot \det(\mathbf {P} )^{-1}=\det(\mathbf {B} )}
[ 14]
行列式是所有特徵值 (按代數重數計)的乘積。這可由矩陣必和其若爾當標準型 相似推導出[ 15] :39-40 。特殊地,三角矩陣 的行列式等於其對角線上所有元素的乘積[ 15] :40 。
由於三角矩陣的行列式計算簡便,當矩陣的係數為域 時,可以通過高斯消去法 將矩陣變換成三角矩陣,或者將矩陣分解成三角矩陣的乘積之後再利用行列式的乘法定理進行計算。可以證明,所有的矩陣A 都可以分解成一個上三角矩陣U 、一個下三角矩陣L 以及一個置換矩陣 P 的乘積:
A
=
P
⋅
L
⋅
U
{\displaystyle A=P\cdot L\cdot U}
。這時,矩陣A 的行列式可以寫成:
det
(
A
)
=
det
(
P
)
⋅
det
(
L
)
⋅
det
(
U
)
=
sgn
(
σ
P
)
⋅
∏
i
=
1
n
l
i
i
⋅
∏
i
=
1
n
u
i
i
.
{\displaystyle \det(A)=\det(P)\cdot \det(L)\cdot \det(U)=\operatorname {sgn}(\sigma _{P})\cdot \prod _{i=1}^{n}l_{ii}\cdot \prod _{i=1}^{n}u_{ii}.}
[ 6] :236-237
分塊矩陣的行列式並不能簡單地表示成每個分塊的行列式的乘積組合。對於分塊的三角矩陣,仍然有類似的結論:
det
(
A
0
C
D
)
=
det
(
A
B
0
D
)
=
det
(
A
)
det
(
D
)
{\displaystyle \det {\begin{pmatrix}A&0\\C&D\end{pmatrix}}=\det {\begin{pmatrix}A&B\\0&D\end{pmatrix}}=\det(A)\det(D)}
,矩陣的行列式等於對角元素的行列式之乘積。
對於一般情況,若對角元素中有一個是可逆矩陣,則可以分塊計算矩陣的行列式。如果A 可逆,那麼矩陣的行列式可以分解為:
det
(
A
B
C
D
)
=
det
(
A
)
det
(
D
−
C
A
−
1
B
)
.
{\displaystyle \det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(A)\det(D-CA^{-1}B).}
[ 16]
如果D 可逆,那麼矩陣的行列式可以分解為:
det
(
A
B
C
D
)
=
det
(
D
)
det
(
A
−
B
D
−
1
C
)
.
{\displaystyle \det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(D)\det(A-BD^{-1}C).}
[ 16]
由分塊矩陣行列式的分解公式,可以推出西爾維斯特定理 :如果A 是n ×m 的矩陣而B 是m ×n 的矩陣,則
det
(
I
n
+
A
B
)
=
det
(
I
m
+
B
A
)
.
{\displaystyle \det(\mathrm {I} _{n}+AB)=\det(\mathrm {I} _{m}+BA).}
[ 16]
矩陣的行列式和矩陣的跡數 有一定的關聯,當矩陣的係數為域 時,在定義了矩陣的指數函數 後,有如下的恆等式:
det
(
exp
(
A
)
)
=
exp
(
t
r
(
A
)
)
{\displaystyle \det(\exp(A))=\exp(\mathrm {tr} (A))}
[ 17] :439
行列式的展開
對一個n 階的矩陣M ,去掉M 的第i 列與第j 行後形成的n -1階矩陣的行列式叫做M 關於元素mij 的餘子式 ,記作Mij [ 2] :3-5 。
M
i
j
=
|
m
1
,
1
…
m
1
,
j
−
1
m
1
,
j
+
1
…
m
1
,
n
⋮
⋮
⋮
⋮
m
i
−
1
,
1
…
m
i
−
1
,
j
−
1
m
i
−
1
,
j
+
1
…
m
i
−
1
,
n
m
i
+
1
,
1
…
m
i
+
1
,
j
−
1
m
i
+
1
,
j
+
1
…
m
i
+
1
,
n
⋮
⋮
⋮
⋮
m
n
,
1
…
m
n
,
j
−
1
m
n
,
j
+
1
…
m
n
,
n
|
{\displaystyle M_{ij}={\begin{vmatrix}m_{1,1}&\dots &m_{1,j-1}&m_{1,j+1}&\dots &m_{1,n}\\\vdots &&\vdots &\vdots &&\vdots \\m_{i-1,1}&\dots &m_{i-1,j-1}&m_{i-1,j+1}&\dots &m_{i-1,n}\\m_{i+1,1}&\dots &m_{i+1,j-1}&m_{i+1,j+1}&\dots &m_{i+1,n}\\\vdots &&\vdots &\vdots &&\vdots \\m_{n,1}&\dots &m_{n,j-1}&m_{n,j+1}&\dots &m_{n,n}\end{vmatrix}}}
皮埃爾-西蒙·拉普拉斯
將M 關於元素mij 的餘子式乘以一個符號係數,就得到M 關於元素mij 的代數餘子式 Cij 。其中的符號係數定義為-1的行數加列數次方:
C
i
j
=
(
−
1
)
(
i
+
j
)
⋅
M
i
j
{\displaystyle C_{ij}=(-1)^{(i+j)}\cdot M_{ij}}
[ 2] :3-5
如果行數與列數的和是偶數,那麼Cij = Mij ;否則Cij = -Mij 。
行列式關於行和列的展開
一個n 階矩陣M 的行列式可以寫成它某一行(或一列)的元素與對應的代數餘子式的乘積之和。這種關係稱為行列式按一行(或一列)的展開。
det
M
=
∑
i
=
1
n
m
i
j
C
i
j
{\displaystyle \det {M}=\sum _{i=1}^{n}m_{ij}C_{ij}}
det
M
=
∑
j
=
1
n
m
i
j
C
i
j
{\displaystyle \det {M}=\sum _{j=1}^{n}m_{ij}C_{ij}}
這個公式又稱拉普拉斯公式 。它把n 階矩陣的行列式計算變為了n 個n -1階行列式的計算[ 2] :3-5 [ 3] :47-48 。另一方面,拉普拉斯公式可以看作是行列式的一種歸納定義:在定義了二維行列式後,n 階矩陣的行列式可以藉助拉普拉斯公式用n -1階矩陣的行列式來定義。這樣定義的行列式與前面的定義是等價的[ 1] :92 。
伴隨矩陣
一個矩陣M 的伴隨矩陣是由矩陣M 的代數餘子式構成的矩陣:
Com
M
=
[
C
i
j
]
1
≤
i
,
j
≤
n
{\displaystyle \operatorname {Com} {M}=\left[C_{ij}\right]_{1\leq i,j\leq n}}
伴隨矩陣是行列式關於行與列展開的自然推廣。如果觀察伴隨矩陣的轉置矩陣與原矩陣的乘積,就可以發現,乘積的每一個元素都是原矩陣的行列式按行(列)的展開式,因此都等於原矩陣的行列式:
M
×
t
Com
M
=
t
Com
M
×
M
=
det
M
×
I
n
.
{\displaystyle M\times {}^{\operatorname {t} }\operatorname {Com} {M}={}^{\operatorname {t} }\operatorname {Com} {M}\times M=\det {M}\times \mathrm {I} _{n}.}
當矩陣M 的行列式不等於0時,M 的伴隨矩陣正等於M 的逆矩陣乘以M 的行列式。因此伴隨矩陣實際上給出了一種計算逆矩陣的方法。
行列式的計算
計算行列式的值是一個常見的問題。最簡單的方法是按照定義
det
(
A
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
i
,
σ
(
i
)
{\displaystyle \det(A)=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{i,\sigma (i)}}
計算或按照拉普拉斯公式 進行遞歸 運算。這樣的算法需要計算
n
!
{\displaystyle n!}
次的加法,複雜度是指數函數。在實際的計算中只能用於計算階數很小的行列式。注意到拉普拉斯公式的性質,如果一行或一列裏面有很多個0,那麼就可以把行列式按這一行或一列展開,這時數值為零的係數所對應的代數餘子式就不必計算了,因為最後要乘以0,這樣就可以簡化計算。然而更加簡便的算法是利用高斯消去法 或LU分解法 ,把矩陣通過初等變換變成三角矩陣 或三角矩陣的乘積來計算行列式的值。這些算法的複雜度都是
n
3
{\displaystyle n^{3}}
級別,遠遠小於直接計算的複雜度。[ 18] :44-49
如果行列式的元素都是某個域中的元素(即可以執行除法),那麼從任一個可以在
O
(
n
s
)
{\displaystyle {\mathit {O}}(n^{s})}
次運算內算出矩陣乘積的算法出發,都可以構造出一種
O
(
n
s
)
{\displaystyle {\mathit {O}}(n^{s})}
次運算內的行列式求值算法。反之亦然。這說明求矩陣的行列式的值和矩陣的乘法有相同的最小複雜度。於是,通過分治算法或者其它的方法,可以達到比
O
(
n
3
)
{\displaystyle {\mathit {O}}(n^{3})}
更好的結果。比如,由於Coppersmith-Winograd算法 可以在
O
(
n
ω
)
{\displaystyle {\mathit {O}}(n^{\omega })}
次運算(其中
ω
≈
2.375477
{\displaystyle \omega \approx 2.375477}
[ note 2] )中計算矩陣乘法,所以也存在
O
(
n
ω
)
{\displaystyle {\mathit {O}}(n^{\omega })}
次運算以內的行列式求值算法。[ 19] [ 20]
如果行列式的元素是某個環中的元素(比如說都是整數),在不執行除法,以字節運算次數來作為複雜度單位的情況下,則需要考慮行列式元素本身的大小。設一個n 階行列式A 中絕對值最大的元素占的字節數為bA ,則現有算法可以在
O
(
(
n
η
b
A
)
1
+
o
(
1
)
)
,
η
=
ω
+
1
−
ζ
w
2
−
(
2
+
ζ
)
ω
+
2
{\displaystyle {\mathit {O}}{\big (}(n^{\eta }b_{A})^{1+{\mathit {o}}(1)}{\big )},\quad \eta =\omega +{\frac {1-\zeta }{w^{2}-(2+\zeta )\omega +2}}}
次字節運算內計算行列式的值。其中的
ζ
{\displaystyle \zeta }
是使得域上的n × n 矩陣和n × nζ 矩陣的乘法能夠在
O
(
n
2
+
o
(
1
)
)
{\displaystyle {\mathit {O}}{\big (}n^{2+{\mathit {o}}(1)}{\big )}}
次運算內得出結果的最小實數。[ 19]
行列式函數的分析性質
由行列式的一般表達形式中可以看出,矩陣的行列式是關於其係數的多項式。因此行列式函數具有良好的光滑性質。
單變量的行列式函數
設矩陣函數
t
↦
A
(
t
)
{\displaystyle t\mapsto A(t)}
為
C
k
{\displaystyle {\mathcal {C}}^{k}}
(k 階連續可導 )的函數。由於行列式函數
t
↦
det
A
(
t
)
{\displaystyle t\mapsto \det A(t)}
是矩陣
A
(
t
)
{\displaystyle A(t)}
係數的多項式函數,所以也是
C
k
{\displaystyle {\mathcal {C}}^{k}}
的。它對t 的導數為
d
d
t
(
det
(
A
1
(
t
)
,
⋯
,
A
n
(
t
)
)
)
=
∑
i
=
1
n
det
(
A
1
(
t
)
,
…
,
A
i
−
1
(
t
)
,
A
i
′
(
t
)
,
A
i
+
1
(
t
)
,
…
,
A
n
(
t
)
)
{\displaystyle {\frac {\rm {d}}{{\rm {d}}t}}\left(\det(A_{1}(t),\cdots ,A_{n}(t))\right)=\sum _{i=1}^{n}\det(A_{1}(t),\dots ,A_{i-1}(t),A'_{i}(t),A_{i+1}(t),\dots ,A_{n}(t))}
,其中的每個
A
i
(
t
)
{\displaystyle A_{i}(t)}
是矩陣
A
(
t
)
{\displaystyle A(t)}
的第i 個行向量(也可以全部是列向量)。[ 21] :23-24
矩陣的行列式函數
函數
A
↦
det
A
{\displaystyle A\mapsto \det A}
是連續的。由此,n階一般線性群 是一個開集 ,因為是開區間
R
−
{
0
}
{\displaystyle \mathbb {R} -\left\{0\right\}}
的原像,而特殊線性群 則是一個閉集 ,因為是閉集合
{
1
,
−
1
}
{\displaystyle \left\{1,-1\right\}}
的原像[ 22] 。
函數
A
↦
det
A
{\displaystyle A\mapsto \det A}
也是可微的 ,甚至是光滑 的(
C
∞
{\displaystyle {\mathcal {C}}^{\infty }}
)[ 23] 。它在某個矩陣A 處的展開為
det
(
A
+
H
)
=
det
A
+
t
r
(
t
C
o
m
(
A
)
.
H
)
+
o
(
‖
H
‖
)
{\displaystyle \det(A+H)=\det A+{\rm {tr}}({}^{t}{\rm {Com}}(A).H)+o(\|H\|)}
[ 24]
也就是說,在裝備正則範數 的矩陣空間Mn (
R
{\displaystyle \mathbb {R} }
)中,伴隨矩陣 是行列式函數的梯度 :
∇
det
(
A
)
=
C
o
m
(
A
)
{\displaystyle \nabla \det(A)={\rm {Com}}(A)}
[ 25] :272
特別當A 為單位矩陣 時,
det
(
I
n
+
H
)
=
1
+
t
r
(
H
)
+
o
(
‖
H
‖
)
,
∇
det
(
I
n
)
=
I
n
{\displaystyle \det(\mathrm {I} _{n}+H)=1+{\rm {tr}}(H)+o(\|H\|),\qquad \nabla \det(\mathrm {I} _{n})=\mathrm {I} _{n}}
可逆矩陣行列式的可微性說明一般線性群GLn (
R
{\displaystyle \mathbb {R} }
)是一個李群 [ 26] 。
與外代數的關係
行列式與外代數 有密切的關係,因為外代數正是在給定的交換環
K
{\displaystyle \mathbb {K} }
上的自由
K
{\displaystyle \mathbb {K} }
-模V 上最「一般性」的有交替性質的結合代數 ,記為
∧
(
V
)
{\displaystyle \wedge (V)}
。外代數是由楔積 構造而成的,而楔積在V 上的交替性質表現如下(定義):
楔積是滿足結合律 的雙線性 的二元運算,使得對於所有向量
v
∈
V
{\displaystyle v\in V}
,
v
∧
v
=
0
{\displaystyle v\wedge v=0}
這表示
對於所有向量
u
,
v
∈
V
{\displaystyle u,v\in V}
,
u
∧
v
=
−
v
∧
u
{\displaystyle u\wedge v=-v\wedge u}
,以及
當
v
1
,
…
,
v
k
∈
V
{\displaystyle v_{1},\ldots ,v_{k}\in V}
線性相關 時,
v
1
∧
v
2
∧
⋯
∧
v
k
=
0
{\displaystyle v_{1}\wedge v_{2}\wedge \cdots \wedge v_{k}=0}
。
所有形同
v
1
∧
v
2
∧
⋯
∧
v
k
{\displaystyle v_{1}\wedge v_{2}\wedge \cdots \wedge v_{k}}
的元素稱為k -向量 。所有k -向量構成了
∧
(
V
)
{\displaystyle \wedge (V)}
的一個子空間,稱為V 的k -階外冪 ,記為
∧
k
(
V
)
{\displaystyle \wedge ^{k}(V)}
。行列式函數是n 重交替線性形式,所以可以看成是將n 個
K
n
{\displaystyle \mathbb {K} ^{n}}
裏面的向量映射到它們對應的n -階外冪
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
這樣一個映射。由於
K
n
{\displaystyle \mathbb {K} ^{n}}
的k -階外冪
∧
k
(
K
n
)
{\displaystyle \wedge ^{k}(\mathbb {K} ^{n})}
的維數等於組合數
(
n
k
)
{\displaystyle {\binom {n}{k}}}
,
∧
n
(
R
n
)
{\displaystyle \wedge ^{n}(\mathbb {R} ^{n})}
的維數是
(
n
n
)
=
1
{\displaystyle {\binom {n}{n}}=1}
,因此
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
實際上同構 於
K
{\displaystyle \mathbb {K} }
,所以行列式實際上可以定義為n 個
K
n
{\displaystyle \mathbb {K} ^{n}}
裏面的向量映射到它們對應的n- 階外冪
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
的映射。行列式理論實際上是外代數理論的一部分。[ 3] :311-319 [ 27] :747-760
對三維歐幾里得空間中
R
3
{\displaystyle \mathbb {R} ^{3}}
可以建立一個線性同構
ϕ
:
Λ
2
(
R
3
)
→
R
3
{\displaystyle \phi :\Lambda ^{2}(\mathbb {R} ^{3})\rightarrow \mathbb {R} ^{3}}
如下:任取
R
3
{\displaystyle \mathbb {R} ^{3}}
的右手的 標準正交基
i
{\displaystyle {\boldsymbol {i}}}
,
j
{\displaystyle {\boldsymbol {j}}}
,
k
{\displaystyle {\boldsymbol {k}}}
,規定
ϕ
{\displaystyle \phi }
把
i
∧
j
{\displaystyle {\boldsymbol {i}}\wedge \mathbf {j} }
,
j
∧
k
{\displaystyle {\boldsymbol {j}}\wedge {\boldsymbol {k}}}
,
k
∧
i
{\displaystyle {\boldsymbol {k}}\wedge {\boldsymbol {i}}}
分別映射為
k
{\displaystyle {\boldsymbol {k}}}
,
i
{\displaystyle {\boldsymbol {i}}}
,
j
{\displaystyle {\boldsymbol {j}}}
,則
ϕ
{\displaystyle \phi }
的定義與右手的標準正交基如何選取無關。
對任意向量
u
{\displaystyle {\boldsymbol {u}}}
和
v
{\displaystyle {\boldsymbol {v}}}
,這個線性同構把楔積
u
∧
v
{\displaystyle {\boldsymbol {u}}\wedge {\boldsymbol {v}}}
映射為叉積
u
×
v
{\displaystyle {\boldsymbol {u}}\times {\boldsymbol {v}}}
。這就是叉乘 (向量積)的實質。叉積可以用帶向量的行列式:
a
×
b
=
det
[
i
j
k
a
1
a
2
a
3
b
1
b
2
b
3
]
{\displaystyle \mathbf {a} \times \mathbf {b} =\det {\begin{bmatrix}\mathbf {i} &\mathbf {j} &\mathbf {k} \\a_{1}&a_{2}&a_{3}\\b_{1}&b_{2}&b_{3}\\\end{bmatrix}}}
來表示,但要注意這個行列式形式並不代表一個「真正」的行列式,因為第一行的分量不是數,而是向量。這個計算之所以正確是得益於線性同構
ϕ
{\displaystyle \phi }
。[ 27]
歷史
行列式的概念最初是伴隨着方程 組的求解而發展起來的。行列式的提出可以追溯到十七世紀,最初的雛形由日本 數學家 關孝和 與德國 數學家戈特弗里德·萊布尼茨 各自獨立得出。
早期研究
關孝和在《解伏題之法》中首次運用行列式的概念
1545年,卡當在著作《大術 》(Ars Magna )中給出了一種解兩個一次方程組的方法。他把這種方法稱為「母法」(regula de modo )。這種方法和後來的克萊姆法則 已經很相似了,但卡當並沒有給出行列式的概念[ 28] :766-774 。
1683年,日本數學家關孝和 在其著作《解伏題之法》中首次引進了行列式的概念。書中出現了
2
×
2
{\displaystyle 2\times 2}
、
3
×
3
{\displaystyle 3\times 3}
乃至
5
×
5
{\displaystyle 5\times 5}
的行列式,行列式被用來求解高次方程組[ 29] [ 30] 。
1693年,德國數學家萊布尼茨開始使用指標數的系統集合來表示有三個未知數的三個一次方程組的係數。他從三個方程的系統中消去了兩個未知量後得到一個行列式。這個行列式不等於零,就意味着有一組解同時滿足三個方程[ 31] :229-245 [ 32] [ 29] 。由於當時沒有矩陣的概念,萊布尼茨將行列式中元素的位置用數對來表示:ij 代表第i 行第j 列。萊布尼茨對行列式的研究成果中已經包括了行列式的展開 和克萊姆法則 ,但這些結果在當時並不為人所知[ 33] 。
任意階數的行列式
1730年,蘇格蘭 數學家科林·麥克勞林 在他的《論代數》中已經開始闡述行列式的理論,記載了用行列式解二元、三元和四元一次方程的方法,並給出了四元一次方程組的一般解的正確形式,儘管這本書直到麥克勞林逝世兩年後(1748年)才得以出版[ 34] 。
約瑟夫·拉格朗日
1750年,瑞士 的加布里爾·克萊姆 首先在他的《代數曲線分析引論》給出了n 元一次方程組求解的法則,用於確定經過五個點的一般二次曲線 的係數,但並沒有給出證明[ 35] 。其中行列式的計算十分複雜,因為是定義在奇置換和偶置換 上的[ 36] 。
此後,關於行列式的研究逐漸增多。1764年,法國的艾蒂安·裴蜀 的論文中關於行列式的計算方法的研究簡化了克萊姆法則,給出了用結式 來判別線性方程組的方法[ 37] :288–338 。同是法國人的亞歷山德·西奧菲勒·范德蒙德 (Alexandre-Théophile Vandermonde )則在1771年的論著中第一個將行列式和解方程理論分離,對行列式單獨作出闡述。這是數學家們開始對行列式本身進行研究的開端[ 38] :516-532 。
1772年,皮埃爾-西蒙·拉普拉斯 在論文《對積分和世界體系的探討》中推廣了范德蒙德著作裏面將行列式展開為若干個較小的行列式之和的方法,發展出子式 的概念。一年後,約瑟夫·拉格朗日 發現了
3
×
3
{\displaystyle 3\times 3}
的行列式與空間中體積的聯繫。他發現:原點和空間中三個點所構成的四面體 的體積,是它們的坐標所組成的行列式的六分之一[ 39] [ 37] 。
行列式在大部分歐洲語言中被稱為「determinant」(某些語言中詞尾加e或o,或變成s),這個稱呼最早是由卡爾·弗里德里希·高斯 在他的《算術研究 》中引入的。這個稱呼的詞根有「決定」意思,因為在高斯的使用中,行列式能夠決定二次曲線 的性質。在同一本著作中,高斯還敘述了一種通過係數之間加減來求解多元一次方程組的方法,也就是現在的高斯消元法 [ 37] 。
行列式的現代概念
詹姆斯·約瑟夫·西爾維斯特
進入十九世紀後,行列式理論進一步得到發展和完善。奧古斯丁·路易·柯西 在1812年首先將「determinant」一詞用來表示十八世紀出現的行列式,此前高斯只不過將這個詞限定在二次曲線所對應的係數行列式中。柯西也是最早將行列式排成方陣並將其元素用雙重下標表示的數學家(垂直線記法是阿瑟·凱萊 在1841年率先使用的)[ 40] :198 。柯西還證明了行列式的乘法定理 (實際上是矩陣乘法),這個定理曾經在雅克·菲利普·瑪利·比內 (Jacque Philippe Marie Binet )的書中出現過,但沒有證明[ 40] :198 [ 41] [ 37] 。
十九世紀五十年代,凱萊和詹姆斯·約瑟夫·西爾維斯特 將矩陣 的概念引入數學研究中[ 40] :208-209 。行列式和矩陣之間的密切關係使得矩陣論 蓬勃發展的同時也帶來了許多關於行列式的新結果,例如阿達馬不等式 、正交行列式、對稱行列式等等[ 40] :207 。
與此同時,行列式也被應用於各種領域中。高斯在二次曲線 和二次型 的研究中使用行列式作為二次曲線 和二次型 劃歸為標準型時的判別依據。十九世紀五十年代後,卡爾·魏爾斯特拉斯 和西爾維斯特又完善了二次型理論,研究了
λ
{\displaystyle \lambda }
-矩陣的行列式以及初等因子 [ 42] :115-152 [ 43] [ 44] [ 45] :205-206 。行列式被用於多重函數的積分大約始於十九世紀三十年代。1832年至1833年間卡爾·雅可比 發現了一些特殊結果,1839年,歐仁·查爾·卡塔蘭 (Eugène Charles Catalan )發現了所謂的雅可比行列式 [ 45] :200 。1841年,雅可比發表了一篇關於函數行列式的論文,討論函數的線性相關性 與雅可比行列式的關係[ 46] 。整個十九世紀中,數學家對行列式的性質進行了大量研究,很多特殊行列式如對稱與斜對稱行列式、加邊行列式、複合行列式的性質也得到研究[ 45] :207 。
現代的行列式概念最早在19世紀末傳入中國。1899年,華蘅芳 和英國傳教士傅蘭雅合譯了《算式解法》十四卷,其中首次將行列式翻譯成「定準數」。1909年顧澄在著作中稱之為「定列式」。1935年8月,中國數學會審查各種術語譯名,9月教育部公佈的《數學名詞》中正式將譯名定為「行列式」。其後「行列式」作為譯名沿用至今。[ 47]
應用
行列式與線性方程組
行列式的一個主要應用是解線性方程組 。當線性方程組的方程個數與未知數 個數相等時,方程組不一定總是有唯一解。對一個有n 個方程和n 個未知數的線性方程組,我們研究未知數係數所對應的行列式。這個線性方程組有唯一解若且唯若 它對應的行列式不為零。這也是行列式概念出現的根源[ 40] :361 。
當線性方程組對應的行列式不為零時,由克萊姆法則 ,可以直接以行列式的形式寫出方程組的解。但用克萊姆法則求解計算量巨大,因此並沒有實際應用價值,一般用於理論上的推導[ 48] 。
行列式與矩陣
矩陣的概念出現得比行列式晚,直到十九世紀中期才被引入,然而兩者在本質上仍然有密切關係。通過矩陣,線性方程組可以表示為
A
x
=
b
{\displaystyle \mathbf {A} x=b}
其中
A
{\displaystyle \mathbf {A} }
是由方程組中未知數的係數構成的方塊矩陣,
x
=
(
x
1
,
x
2
,
⋯
,
x
n
)
T
{\displaystyle x=(x_{1},x_{2},\cdots ,x_{n})^{\mathbf {T} }}
是未知數,而
b
=
(
b
1
,
b
2
,
⋯
,
b
n
)
T
{\displaystyle b=(b_{1},b_{2},\cdots ,b_{n})^{\mathbf {T} }}
。
在矩陣理論中,行列式也有各種用途。多項式
p
(
x
)
=
det
(
x
I
−
A
)
{\displaystyle p(x)=\det(xI-A)}
稱為方塊矩陣A 的特徵多項式。這是一個由行列式定義的多項式,它的解是矩陣所有的特徵值 。換句話說,x 是矩陣A 的特徵值若且唯若xI - A 不是可逆矩陣。特徵值多項式在矩陣理論中有重要的應用[ 2] :213-214 。
西爾維斯特準則 則將實 埃爾米特矩陣 的正定性 與其主對角線上的子矩陣 的行列式對應起來。如果n 階實係數埃爾米特矩陣
A
=
(
a
i
j
)
1
≤
i
,
j
≤
n
{\displaystyle A=(a_{ij})_{1\leq i,j\leq n}}
的所有主子矩陣:
A
k
=
(
a
i
j
)
1
≤
i
,
j
≤
k
,
1
≤
k
≤
n
{\displaystyle A_{k}=(a_{ij})_{1\leq i,j\leq k},\,\,1\leq k\leq n}
的行列式都是正數,那麼A 的所有特徵值都是正數,即A 為正定矩陣 。
行列式與多項式
早在高斯的時代,行列式就和多項式的研究聯繫在一起。行列式的一個應用是在所謂的「結式 」上。結式是兩個多項式
p
{\displaystyle \displaystyle p}
和
q
{\displaystyle \displaystyle q}
的西爾維斯特矩陣 的行列式。兩個多項式的結式等於0 若且唯若它們有高於或等於一次的公因子多項式。結式還可以判斷多項式是否有重根:如果多項式
p
{\displaystyle \displaystyle p}
和它的微分多項式
p
′
{\displaystyle \displaystyle p^{\prime }}
的結式不為零,那麼這個多項式沒有重根,否則有重根[ 49] 。
行列式在多項式逼近理論 中也有出現。給定一組插值點,判別插值多項式的存在性需要看所謂的范德蒙矩陣 ,而由於范德蒙矩陣的行列式不為零,因此根據克萊姆法則,插值多項式唯一存在(次數小於插值點個數)[ 50] :247 。
朗斯基行列式
朗斯基行列式是函數矩陣的行列式,因此本身也是一個函數。給定n 個n- 1次連續 可微 函數,f1 、...、fn ,它們的朗斯基行列式W(f1 , ..., fn ) 為:
W
(
f
1
,
…
,
f
n
)
(
t
)
=
|
f
1
(
t
)
f
2
(
t
)
⋯
f
n
(
t
)
f
1
′
(
t
)
f
2
′
(
t
)
⋯
f
n
′
(
t
)
⋮
⋮
⋱
⋮
f
1
(
n
−
1
)
(
t
)
f
2
(
n
−
1
)
(
t
)
⋯
f
n
(
n
−
1
)
(
t
)
|
{\displaystyle W(f_{1},\ldots ,f_{n})(t)={\begin{vmatrix}f_{1}(t)&f_{2}(t)&\cdots &f_{n}(t)\\f_{1}'(t)&f_{2}'(t)&\cdots &f_{n}'(t)\\\vdots &\vdots &\ddots &\vdots \\f_{1}^{(n-1)}(t)&f_{2}^{(n-1)}(t)&\cdots &f_{n}^{(n-1)}(t)\end{vmatrix}}}
[ 51] :15-17
可以證明,如果f1 、...、fn 線性相關,那麼它們的朗斯基行列式恆等於零[ 51] :15-17 。
在線性微分動力系統理論中,朗斯基行列式用來判別若干個解的線性相關性。如果n 個解f1 、...、fn 線性無關,那麼它們的朗斯基行列式將總不為零[ 52] 。根據劉維爾定理,n 維空間上的線性微分方程:
Y
′
=
A
(
t
)
Y
{\displaystyle Y^{\prime }=A(t)Y}
的基礎解系所構成的朗斯基行列式
W
(
t
)
{\displaystyle W(t)}
滿足:
W
′
(
t
)
=
t
r
A
(
t
)
W
(
t
)
{\displaystyle W'(t)={\rm {tr}}\,A(t)W(t)}
,[ 51] :15-17
同樣地,線性微分方程:
y
(
n
)
=
a
0
(
t
)
y
+
a
1
(
t
)
y
′
+
a
2
(
t
)
y
″
+
.
.
.
+
a
n
−
1
(
t
)
y
(
n
−
1
)
{\displaystyle y^{(n)}=a_{0}(t)y+a_{1}(t)y'+a_{2}(t)y''+...+a_{n-1}(t)y^{(n-1)}\,}
的基礎解系所構成的朗斯基行列式
W
(
t
)
{\displaystyle W(t)}
滿足:
W
′
(
t
)
=
a
n
−
1
(
t
)
W
(
t
)
{\displaystyle W'(t)=a_{n-1}(t)W(t)}
[ 51] :15-17
行列式與多重積分
雅可比行列式是把一個體積元(藍色)變換成另一個(紅色)時兩者的體積之比
行列式體現了線性變換對於空間體積的作用,對於非線性的函數,其對體積的影響更為複雜,但對於足夠「良好」的函數,在一個微小的範圍內,比如說在空間中一點的附近,可以將函數的效果近似地用線性的變換來代替。由此,對於某些函數,也可以將它在某一點附近的作用效果用它在這一點上的偏導數構成的矩陣(稱為雅可比矩陣 )來表示。這類行列式被稱為「雅可比行列式 」,即是雅可比矩陣 的行列式,只對連續可微 的函數有定義[ 53] :112-115 。
在計算「體積」的多重積分中,雅可比行列式應用於換元積分 的時候。積分的思想是將空間割成許多個微小的體積元,稱為積分元素,再將每個體積元上的函數值乘以體積元的體積後相加。將一個積分元素換為另一個積分元素時,實際上作了一次對空間中體積的度量方式的改變:分劃體積元的方式不同了。譬如在二維空間中,將直角坐標 積分換為極坐標 積分時,面積元素由方塊區域變成扇形區域。因此,要測量這種體積度量方式的改變,可以將這種變換看成一個非線性的變換函數(實際上是一個微分同胚 ):
φ
:
R
n
⟶
R
n
{\displaystyle \varphi :\mathbb {R} ^{n}\longrightarrow \mathbb {R} ^{n}}
。而它在每一點的影響可以通過雅可比行列式來體現[ 54] :79-85 。
行列式與非線性方程組及分枝理論
運用雅可比行列式的還有非線性方程組的數值求解。對於一般的非線性方程組,不存在求解公式,只能夠用數值分析的方法求近似解。求近似解的基本思想也是將非線性問題在局部的地方逐步線性化,化歸為線性方程組來求解。設有方程組:
{
f
1
(
x
1
,
x
2
,
⋯
,
x
n
)
=
0
⋮
⋮
f
n
(
x
1
,
x
2
,
⋯
,
x
n
)
=
0
{\displaystyle {\begin{cases}f_{1}(x_{1},x_{2},\cdots ,x_{n})=0\\\quad \vdots \qquad \qquad \qquad \vdots \quad \\f_{n}(x_{1},x_{2},\cdots ,x_{n})=0\end{cases}}}
其中
f
=
(
f
1
,
⋯
,
f
n
)
{\displaystyle f=(f_{1},\cdots ,f_{n})}
是連續可微函數,並在解的附近雅可比行列式不為零,那麼可以用牛頓法迭代求得近似解。迭代程序為:
f
(
x
(
k
+
1
)
)
=
x
(
k
)
−
det
(
J
f
(
x
(
k
)
)
)
−
1
f
(
x
(
k
)
)
(
k
=
0
,
1
,
⋯
)
{\displaystyle f(x^{(k+1)})=x^{(k)}-\det(\mathbf {J} _{f}(x^{(k)}))^{-1}f(x^{(k)})\qquad (k=0,1,\cdots )}
其中的
x
(
k
)
=
(
x
1
(
k
)
,
x
2
(
k
)
,
⋯
,
x
n
(
k
)
)
{\displaystyle x^{(k)}=(x_{1}^{(k)},x_{2}^{(k)},\cdots ,x_{n}^{(k)})}
是第k 次迭代時的解的近似數值。每次迭代時先求解關於線性方程組
J
f
(
x
(
k
)
)
Δ
x
(
k
)
=
f
(
x
(
k
)
)
{\displaystyle \mathbf {J} _{f}(x^{(k)})\Delta x^{(k)}=f(x^{(k)})}
然後計算新的近似值
x
(
k
+
1
)
=
x
(
k
)
−
Δ
x
(
k
)
{\displaystyle x^{(k+1)}=x^{(k)}-\Delta x^{(k)}}
[ 55]
在實際應用中,還需要考慮帶有參數的非線性方程組:
{
f
1
(
x
1
,
x
2
,
⋯
,
x
n
,
λ
)
=
0
⋮
⋮
f
n
(
x
1
,
x
2
,
⋯
,
x
n
,
λ
)
=
0
{\displaystyle {\begin{cases}f_{1}(x_{1},x_{2},\cdots ,x_{n},\lambda )=0\\\quad \vdots \qquad \qquad \qquad \vdots \quad \\f_{n}(x_{1},x_{2},\cdots ,x_{n},\lambda )=0\end{cases}}}
其中的
λ
{\displaystyle \lambda }
可以代表溫度 、外力 等環境因素。當環境改變時,方程解上的雅可比行列式可能從非零變為零。雅可比行列式為零的點稱為臨界點或分支點,是方程的解改變性質的地方。和線性方程組類似,當雅可比行列式的值為零時,方程組會出現局部多值的情況。尋找分支點和分支方向的研究是非線性方程求解的一大問題。[ 56]
參見
註釋
^ ,因為行列式按照定義可以看成關於矩陣係數的多項式。另一方面,若干個複數乘積或和的共軛等於其共軛的乘積或和。從而當每個係數都取共軛後,行列式這個多項式的值也變成原來的共軛。
^ 2014年François Le Gall將
ω
{\displaystyle \omega }
改進為2.3728639
參考資料
^ 1.0 1.1 1.2 1.3 1.4 (中文) 項武義. 《基础代数学》. 人民教育出版社. 2004. ISBN 7-107-17679-X .
^ 2.00 2.01 2.02 2.03 2.04 2.05 2.06 2.07 2.08 2.09 2.10 2.11 2.12 (中文) 居余馬、林翠琴. 《线性代数》. 清華大學出版社. 2002. ISBN 978-7-302-06507-4 .
^ 3.0 3.1 3.2 3.3 3.4 (中文) 張賢科. 《高等代数学》第二版. 清華大學出版社. 2002. ISBN 978-7-302-11088-0 .
^ 4.0 4.1 4.2 (英文) Harold M. Edwards. Linear Algebra . Springer-Verlag New York. 2004年. ISBN 978-0-817-63731-6 .
^ 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 (英文) Werner Hildbert Greub. linear algebra . Springer Verlag. 1975. ISBN 978-0-387-90110-7 .
^ 6.0 6.1 (英文) Gilbert Strang. Linear algebra and its applications . Thomson, Brooks/Cole, Belmont, CA. 2006. ISBN 9780534422004 .
^ (法文) Robert COQUEREAU. Espaces fibrés et Connexions . 2002.
^ 8.0 8.1 8.2 8.3 (英文) Steven Roman. Advanced Linear Algebra . Springer. 2005. ISBN 0-387-24766-1 .
^ (英文) Paul Moritz Cohn. Further algebra and applications . Springer. 2003. ISBN 978-1-852-33667-7 .
^ (英文) A theory of noncommutative determinants and characteristic functions of graphs (PDF) . Functional Analysis and Its Applications (Springer New York). doi:10.1007/BF01075044 .
^ (英文) I. Gelfand, V. Retakh, R. L. Wilson. Quaternionic Quasideterminants and Determinants (PDF) . Quantum Algebra. 2002.
^ (英文) The Cauchy-Binet Formula (PDF) . [2010-05-19 ] .
^ (英文) Gabe Cunningham. The General Linear Group (PDF) . [2010-05-19 ] .
^ (英文) Richard Bronson, Gabriel B. Costa. Linear Algebra: An Introduction . Academic Press. 2007. ISBN 9780120887842 .
^ 15.0 15.1 (英文) N.丹佛,J.T.施瓦茨. 《线性算子》第一章:一般理论. Interscience. 1958.
^ 16.0 16.1 16.2 (英文) Mike Brookes. The Matrix Reference Manual . Imperial College. [2010-02-02 ] .
^ (英文) Roger A. Horn, Charles R. Johnson. Topics in Matrix Analysis . Cambridge University Press. 1991. ISBN 978-0-521-46713-1 .
^ (英文) William H. Press, Brian P. Flannery, Saul A. Teukolsky, William T. Vetterling. Numerical Recipes in C: The Art of Scientific Computing, Second Edition . Cambridge University Press. 1992. ISBN 978-0521431088 .
^ 19.0 19.1 (英文) Erich Kaltofen, Gilles Villard. On the complexity of computing determinants (PDF) . Computational Complexity. doi:10.1007/s00037-004-0185-3 .
^ (英文) Gilles Villard. Exact computation of the determinant and of the inverse of a matrix (PDF) . CNRS - LIP ENS Lyon, INRIA. 2002.
^ (英文) Joel N. Franklin. Matrix Theory . Dover Publications. 2000. ISBN 978-0486411798 .
^ (英文) John O'Connor. The linear groups . [2010-05-20 ] .
^ (英文) Lawrence Conlon. Differentiable manifolds , 2nd edition. Birkhäuser Boston;. 2001. ISBN 978-0817641344 .
^ (英文) Rajendra Bhatia, Tanvi Jai. Higher order derivatives and perturbation Bounds for determinants (PDF) . Indian Statistical Institute, Delhi Centre. [2010-05-20 ] .
^ (中文) 張賢達. 矩阵分析与应用. 清華大學出版社. 2008. ISBN 9787302092711 .
^ (英文) Vladimir G. Ivancevic,Tijana T. Ivancevic. Applied differential geometry: a modern introduction . World Scientific Publishing Company. 2007. ISBN 978-9812706140 .
^ 27.0 27.1 (英文) Joesph J.Rotman. Advanced Modern Algebra . Prentice Hall. 2002. ISBN 978-0-130-87868-7 .
^ (德文) E Knobloch. Determinants , in I Grattan-Guinness (ed.), Companion Encyclopedia of the History and Philosophy of the Mathematical Sciences. London year = 1994: Routledge.
^ 29.0 29.1 (英文) J J O'Connor、E F Robertson. Matrices and determinants .
^ (中文) 曹亮吉. 《關孝和》 . 《科學月刊》第十八卷第二、第三期.
^ (德文) Gottfried Wilhelm, Freiherr von Leibniz. 《莱布尼兹数学文献》(Leibnizens mathematische Schriften )第二卷 . Berlin: A. Asher. 1849-63.
^ (中文) 《行列式》 . 香港教育發展組教育資訊站. [2009-12-10 ] .
^ (德文) E. Knobloch. Der Beginn der Determinantentheorie, Leibnizens nachgelassene Studien zum Determinantenkalkül . Hildesheim. 1980.
^ (英文) C. B. Boyer. A History of Mathematics . John Wiley. 1968.
^ (法文) 加布里爾·克拉默 . Introduction à l'analyse des lignes courbes algébraique . 1750.
^ (德文) M. Cantor. Geschichte der Mathematik . Teubner. 1913.
^ 37.0 37.1 37.2 37.3 (法文) 艾蒂安·裴蜀 . Recherches sur le degré des équations résultantes de l'évanouissement des inconnues, et sur le moyens qu'il convient d'employer pour trouver ces équations . Mém. Acad. Roy. Sci Paris. 1764.
^ (法文) 亞歷山德·西奧菲勒·范德蒙德. Mémoire sur l'élimination, Hist. de l'Acad. Roy. des Sciences Paris . 2e partie. 1772.
^ (法文) 拉格朗日 . Nouvelle solution du problème du mouvement de rotation d'un corps de figure quelconque qui n'est animé par aucune force accélératrice . Nouveaux mémoires de l'Académie royale des sciences et des belles-lettres de Berlin. 1773.
^ 40.0 40.1 40.2 40.3 40.4 (中文) 莫里斯·克萊因 著,張理京、張錦炎、江澤涵 譯. 《古今数学思想》第二卷. 上海科學技術出版社. 2002. ISBN 7-5323-6172-1 .
^ (法文) Mémoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et des signes contraires par suite des transpositions opérées entre les variables qu'elles renferment . Journal de l'Ecole Polytechnique (l'Ecole Royale Polytechnique). 1815: 29–112.
^ (英文) Thomas Hawkins. The Mathematics of Frobenius in Context: A Journey Through 18th to 20th Century Mathematics . Springer. 2013. ISBN 978-1461463320 .
^ (德文) K. Weierstrass. Über ein die homogenen Functionen zweiten Grades betreffendes Theorem . Monatsberichte der Akademie der Wiss (Berlin). 1858: 207–220.
^ (英文) An Enumeration of The Contacts of Lines and Surfaces of Second Order . Philosophical Magazine. 1851, 1 : 119–140.
^ 45.0 45.1 45.2 (中文) 莫里斯·克萊因 著,張理京、張錦炎、江澤涵 譯. 《古今数学思想》第三卷. 上海科學技術出版社. 2002. ISBN 7-5323-6172-1 .
^ (德文) Carl Gustav Jakob. De determinantibus Functionalibus 22 . Paul Stäckel. 1841.
^ (中文) 楊潔菊. 《行列式理论历史研究》. 西北大學博士論文. 2004.
^ (中文) 盧剛. 《线性代数与解析几何》. 高等教育出版社. 2005. ISBN 978-7-040-13651-7 .
^ (中文) 王東明,夏壁燦. 《计算机代数》. 清華大學出版社. 2004. ISBN 9787302159193 .
^ (英文) Matheus Grasselli,Dmitry Pelinovsky. Numerical mathematics . Jones & Bartlett. 2008. ISBN 978-0-763-73767-2 .
^ 51.0 51.1 51.2 51.3 (英文) Andy R. Magid. Lectures on differential Galois theory . American Mathematical Society. 1994. ISBN 978-0821870044 .
^ (中文) 王高雄,周之銘,朱思銘,王壽松. 《常微分方程》. 高等教育出版社. 2006. ISBN 978-7-040-19366-4 .
^ (中文) 清華大學數學科學系《微積分》編寫組. 《微积分》. 清華大學出版社. 2004. ISBN 978-7-302-06004-8 .
^ (中文) 齊民友. 《重温微积分》. 高等教育出版社. 2004. ISBN 7-040-12931-0 .
^ (中文) 李慶揚,莫孜中,祁力群. 《非线性方程组的数值解法》. 科學出版社. 1999. ISBN 7-030-02846-5 .
^ (中文) 武際可,滕寧,鈎袁勇. 《分叉问题及其计算方法》 (PDF) . 《力學與實踐》. 1987, 第4期 .
參考書籍