矩陣指數(matrix exponential)是方塊矩陣的一種矩陣函數,與指數函數類似。矩陣指數給出了矩陣李代數與對應的李群之間的關係。
設X為n×n的實數或複數矩陣。X的指數,用eX或exp(X)來表示,是由以下冪級數所給出的n×n矩陣:
以上的級數總是收斂的,因此X的指數是定義良好的。注意,如果X是1×1的矩陣,則X的矩陣指數就是由X的元素的指數所組成的1×1矩陣。
性質
基本性質
設X和Y為n×n的複數矩陣,並設a和b為任意的複數。我們把n×n的單位矩陣記為I,把零矩陣記為0。
我們可以從指數級數的定義直接得到矩陣指數的如下性質[1]:
- e0 = I
- exp(XT) = (exp X)T,其中XT表示X的轉置。從中可以推出,如果X是對稱矩陣,則eX也是對稱矩陣;如果X是斜對稱矩陣,則eX是正交矩陣。
- 如果Y是可逆矩陣,那麼 eYXY−1 = YeXY−1
接下來是一個關鍵性質:
- 如果那麼
由此導出的推論有:
- eaXebX = e(a + b)X
- eXe−X = I
線性微分方程
矩陣指數的一個重要性,是它可以用來解微分方程。從(1)可知,以下微分方程
其中A是矩陣,具有解
矩陣指數也可以用來解非齊次方程:
參見以下的例子。
當A不是常數時,以下形式的微分方程沒有閉式解:
但馬格努斯級數可以給出無窮級數形式的解。
矩陣指數的行列式
根據雅可比公式,對任意復矩陣,下列跡等式成立:[2]
除了提供一種額外的計算工具,這個等式還表明矩陣指數總是可逆矩陣。這點可以如下證明:因為上述等式的右邊恆不等於0,所以左邊det(eA) ≠ 0,從而eA必可逆。
指數相加
我們知道,對於任何實數(標量)x和y,指數函數都滿足公式ex + y = exey。類似的等式對於可交換矩陣也成立:如果矩陣X和Y是可交換的(即XY = YX),則:
但是,如果它們不是可交換的,則以上的等式不一定成立。
這個命題反過來不成立:eX+Y=eXeY並不一定就意味着X和Y是可交換的。但是,如果X和Y只含有代數數,而且它們的大小至少為2×2,則反過來也成立[3]。
X和Y不可交換的情況可以用以下方法計算:
李乘積公式
即使和不可交換,可以用李乘積公式來計算[4]
貝克爾-坎貝爾-豪斯多夫公式
從另一個方向講,如果和是元素足夠小(但不一定可交換)的矩陣,我們有:
其中可以通過和的交換子的級數(貝克爾-坎貝爾-豪斯多夫公式)來計算:[5]
其中餘項均為與和相關的迭代交換子。
指數映射
注意矩陣的指數總是非奇異方陣。eX的逆矩陣由e−X給出。這與複數的指數總是非零的事實類似。這樣,矩陣指數就給出了一個映射:
這是從所有n×n矩陣的空間到一般線性群(所有非奇異方陣所組成的群)的映射。實際上,這個映射是滿射,就是說每一個非奇異方陣都可以寫成某個矩陣的指數。矩陣對數就是這個映射的逆映射。
對於任何兩個矩陣X和Y,我們有:
其中|| · ||表示任意的矩陣範數。從中可以推出,指數映射在Mn(C)的緊子集內是連續和利普希茨連續的。
以下的映射
定義了一般線性群中的一條光滑曲線,當t = 0時穿過單位元。實際上,這給出了一般線性群的一個單參數子群,這是由於:
這條曲線在點t的導數(或切向量)由以下等式給出:
t = 0時的導數就是矩陣X,所以我們可以說,X是這個單參數子群的推廣。
更加一般地:
矩陣指數的計算
找到可靠而準確的方法來計算矩陣指數是很困難的,這仍然是目前數學和數值分析領域的一個重要研究課題。Matlab、GNU Octave和SciPy都使用帕德近似。[6][7][8] 在本節中,我們討論了原則上適用於任何矩陣的方法,並且可以對小矩陣進行顯式處理。[9] 隨後的章節描述了適合對大矩陣進行數值評估的方法。
可對角化矩陣
如果矩陣是對角的:
則把主對角線上的所有元素取指數,就是原矩陣的指數:
這也允許了我們計算可對角化矩陣的指數。如果,且D是對角矩陣,則。用西爾維斯特公式,也可以得到相同的結果。
冪零矩陣
如果對於某個整數q,有Nq = 0,則矩陣N稱為冪零矩陣。在這種情況下,矩陣指數eN可以直接從級數展開式來計算,這是因為級數在有限個項後就終止了:
推廣
當矩陣X的最小多項式可以分解為一次多項式的積時,它就可以表示為以下的和:
其中:
- A是可對角化矩陣;
- N是冪零矩陣;
- A與N是可交換的(也就是說, AN = NA)。
這稱為Dunford分解。
這就是說,我們可以通過化為前兩種情況,來計算X的指數:
注意為了讓最後一步成立, A和N必須是可交換的。
另外一個密切相關的方法,是利用X的若爾當標準型。假設X = PJP −1,其中J是X的若爾當標準型。那麼:
另外,由於
因此,我們只需要知道怎樣計算若爾當塊的矩陣指數。但是,每一個若爾當塊都具有形式
其中N是冪零矩陣。則這個區塊的矩陣指數由下式給出:
計算
假設我們想要計算以下矩陣的指數。
它的若爾當型為:
其中矩陣P由下式給出:
我們首先來計算exp(J)。我們有:
1×1矩陣的指數僅僅是該矩陣的元素的指數,因此exp(J1(4)) = [e4]。的指數可以用以上提到的公式exp(λ+N) = eλ exp(N)來算出:
因此,原矩陣B的指數為:
應用
線性微分方程
矩陣指數在解線性微分方程時十分有用。前面曾提到,以下形式的微分方程
具有解eCty(0)。如果我們考慮以下向量
我們就可以把線性微分方程表示為:
如果我們作一個猜想,把兩邊乘以一個積分因子 e−At,便得到:
如果我們可以計算eAt,那麼就得到了微分方程的解。
例子(齊次)
假設我們有以下的微分方程組:
相關的矩陣為:
在以上的例子中,我們計算了矩陣指數
因此微分方程組的通解為:
也就是說,
非齊次的情況──參數變換
對於非齊次的情況,我們可以用積分因子的方法(類似於參數變換的方法)。我們找到形為yp(t) = exp(tA)z(t)一個特解:
為了讓yp為方程的解,必須有:
因此,
其中c由問題的初始條件決定。
例子(非齊次)
假設我們有以下的微分方程組:
那麼我們有
以及
用前面的方法,我們可以得出齊次微分方程的解。由於齊次方程的通解與非齊次方程的特解的和就是非齊次方程的通解,因此我們只需要找到一個特解(用參數變換法)。
我們有:
進一步簡化,就可以得到原方程的特解。
註釋
參考文獻
- Horn, Roger A.; Johnson, Charles R., Topics in Matrix Analysis, Cambridge University Press, 1991, ISBN 978-0-521-46713-1 .
- Moler, Cleve; Van Loan, Charles F., Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty-Five Years Later (PDF), SIAM Review, 2003, 45 (1): 3–49 [2008-08-14], ISSN 1095-7200, (原始內容存檔 (PDF)於2008-12-08) .
參閱
外部連結