中心化矩陣

維基百科,自由的百科全書

數學多元變量統計中,中心化矩陣[1]對稱冪等矩陣,且當其與向量相乘時,效果等用於從向量的每個分量中減去分量的平均值

定義

大小為n的中心化矩陣是n×n的

其中單位矩陣是n×n一矩陣。例如

,
,

性質

給定長為n的列向量中心性可表為

其中值全為1的列向量的分量的平均值。

  • 是正半定對稱陣。
  • 冪等矩陣,所以。均值被移除的話它就是零,再次移除也沒有任何影響。
  • 奇異矩陣/不可逆矩陣。應用變換的效果無法逆轉。
  • 具有重數為n-1的特徵值1與重數為1的特徵值0
  • 沿向量有維度為1的零空間
  • 正交投影矩陣。也就是說在n-1維線性子空間上的投影,其與零空間正交(這是所有分量和為0的n向量構成的子空間)。
  • 的跡是

應用

雖然與中心化矩陣相乘並不是去除向量均值的有效計算方法,但卻是一種方便的分析工具。它不僅可用來去除單個向量的均值,還可去除存儲在m×n矩陣的行或列中多個向量的均值。

左乘將從n列的每一列減去相應的均值,這樣積的每列的均值都是0。相似地,右乘會從每行減去相應的均值,這樣積的每行均值都為0。兩側均乘:將產生行列均值均為0的矩陣。

中心化矩陣提供了一種表示散布矩陣的方法:對數據樣本,有,其中樣本均值。有了中心化矩陣,可以將散布矩陣更簡潔地表示為

多項分布協方差矩陣,在特殊情況下分布參數為

參考文獻

  1. ^ John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, ISBN 0-412-99521-2, page 59.