假設檢定
此條目需要精通或熟悉數學的編者參與及協助編輯。 (2012年12月18日) |
假設檢定(英語:hypothesis testing)是推論統計中用於檢驗現有數據是否足以支持特定假設的方法。[1]一旦能估計未知參數,就會希望根據結果對未知的真正參數值做出適當的推論。
欲檢驗統計上假設的正確性的為虛無假設(Null hypothesis,記為),虛無假設通常由研究者決定,反映研究者對未知參數的看法。相對於虛無假設的其他有關參數之論述是對立假設(Alternative hypothesis,記為或),它通常反應了執行檢驗的研究者對參數可能數值的另一種(對立的)看法(換句話說,對立假設通常才是研究者最想證明的)。
說明
假設檢定的過程,可以用法庭的審理來說明。先想像現在法庭上有一名被告,假設該被告是清白的,而檢察官必須要提出足夠的證據去證明被告的確有罪。
在證明被告有罪前,被告是被假設為清白的。
而檢察官提出的證據,是否足以確定該被告有罪,則要經過檢驗。這樣子的檢驗過程就相當於用T檢驗或Z檢驗去檢視研究者所搜集到的統計資料。
檢驗過程
在統計學的文獻中,假設檢定發揮了重要作用。假設檢定大致有如下步驟:
- 最初研究假設為真相不明。
- 提出相關的虛無假設和對立假設。
- 考慮檢驗中對樣本做出的統計假設;例如,關於總體資料的分佈形式或關於獨立性的假設。無效的假設將意味此檢驗的結果是無效的。
- 選擇一個顯著水平(α),若低於這個概率閾值,就拒絕虛無假設。最常用的是5%和1%。
- 選擇適合的檢驗統計量(Test statistic)T。
- 在設定虛無假設為真下推導檢驗統計量的分佈。在標準情況下應該會得出一個熟知的結果。比如檢驗統計量可能會符合正態分佈或司徒頓t分佈。
- 根據在虛無假設成立時的檢驗統計量T分佈,找到概率為顯著水平 (α)的區域,此區域稱為「拒絕域」(記作RR或CR),即在虛無假設成立的前提下,落在拒絕域的概率只有α。
- 針對檢驗統計量T,根據樣本計算其估計值tobs。
- 若估計值tobs未落在拒絕域,則「不拒絕」虛無假設(do no reject )。若估計值tobs落在拒絕域,則拒絕虛無假設,接受對立假設。
要注意的是一般不會將檢驗結果稱作「接受」虛無假設,而是因沒有顯著證據證明虛無假設為非,所以「不拒絕」虛無假設。
例子
女士品茶是一個有關假設檢定的著名例子[2]。統計學家費雪的一個女同事,也是藻類學家的繆麗·布里斯托,她聲稱可以判斷在奶茶中是先加入茶還是先加入牛奶。費雪提議給她八杯奶茶。繆麗已知其中四杯先加茶,四杯先加牛奶,但隨機排列,而她要說出這八杯奶茶中,哪些先加牛奶,哪些先加茶,檢驗統計量是確認正確的次數。虛無假設是她無法判斷奶茶中的茶先加入還是牛奶先加入,對立假設為她有此能力。
若單純以概率考慮(即繆麗沒有判斷的能力)下,八杯都正確的概率為1/70(因為8選4的組合數是70),約1.43%,因此「拒絕域」為八杯的結果都正確。而測試結果為繆麗八杯的結果都正確[3],在統計上是相當顯著的的結果。也就是說,幾乎可以排除她只是恰好猜對結果的可能。
相關條目
參考文獻
- ^ Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.
- ^ Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. James Roy Newman (編). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4. Originally from Fisher's book Design of Experiments.
- ^ Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.