數學和多元變量統計中,中心化矩陣[1]指對稱冪等矩陣,且當其與向量相乘時,效果等用於從向量的每個分量中減去分量的平均值。
定義
大小為n的中心化矩陣是n×n的
其中是單位矩陣,是n×n一矩陣。例如
- ,
- ,
性質
給定長為n的列向量,的中心性可表為
其中是值全為1的列向量,是的分量的平均值。
- 是正半定對稱陣。
- 是冪等矩陣,所以。均值被移除的話它就是零,再次移除也沒有任何影響。
- 是奇異矩陣/不可逆矩陣。應用變換的效果無法逆轉。
- 具有重數為n-1的特徵值1與重數為1的特徵值0
- 沿向量有維度為1的零空間。
- 是正交投影矩陣。也就是說是在n-1維線性子空間上的投影,其與零空間正交(這是所有分量和為0的n向量構成的子空間)。
- 的跡是。
應用
雖然與中心化矩陣相乘並不是去除向量均值的有效計算方法,但卻是一種方便的分析工具。它不僅可用來去除單個向量的均值,還可去除存儲在m×n矩陣的行或列中多個向量的均值。
左乘將從n列的每一列減去相應的均值,這樣積的每列的均值都是0。相似地,右乘會從每行減去相應的均值,這樣積的每行均值都為0。兩側均乘:將產生行列均值均為0的矩陣。
中心化矩陣提供了一種表示散布矩陣的方法:對數據樣本,有,其中是樣本均值。有了中心化矩陣,可以將散布矩陣更簡潔地表示為
是多項分布的協方差矩陣,在特殊情況下分布參數為,。
參考文獻
- ^ John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, ISBN 0-412-99521-2, page 59.