跳转到内容

协方差

本页使用了标题或全文手工转换
维基百科,自由的百科全书

機率論統計學中,共變異數(英語:Covariance)用於衡量随机变量間的相關程度。

「Covariance」的各地常用譯名
中国大陸协方差
臺灣共變異數
港澳協方差
日本、韓國共分散
兩變數X與Y在3種不同的共變異數情況下的關係

定義

定義 — 
样本空间 是定義在 事件族 上的機率。(換句話說, 是個機率空間

是定義在 上的兩個实数随机变量期望值分别为:

則兩者間的协方差定义为:

根據測度積分的線性性質,上面的原始定義可以進一步簡化為:

协方差矩阵

协方差的定義可以推廣到兩列隨機變數之間

定義 — 
機率空間 是定義在 上的兩列实数随机变量序列(也可視為有序对行向量

若二者对应的期望值分别为:

則这两列隨機变量间的协方差定义成一個 矩阵

以上的定義,以矩形來表示就是:

性質

統計獨立

定理 — 若隨機變數 是相互独立的,則

計算性質

如果是实数随机变量,是常数,那么根据协方差的定义可以得到:

对于随机变量序列,有

对于随机变量序列,有

相關係數

取决于协方差的相关性

更准确地说是线性相关性,是一个衡量线性独立的无量纲数,其取值在之间。相关性时称为“完全线性相关”(相关性时称为“完全线性负相关”),此时将作Y-X 散点图,将得到一组精确排列在直线上的点;相关性数值介于-1到1之间时,其绝对值越接近1表明线性相关性越好,作散点图得到的点的排布越接近一条直线。

相关性为0(因而协方差也为0)的两个随机变量又被称为是不相关的,或者更准确地说叫作“线性无关”、“线性不相关”,这仅仅表明两随机变量之间没有线性相关性,并非表示它们之间一定没有任何内在的(非线性)函数关系,和前面所说的“二者并不一定是统计独立的”说法一致。

参见